Dùng AI sáng tạo hình ảnh: chơi dao 2 lưỡi
Dùng AI sáng tạo hình ảnh: chơi dao 2 lưỡi
Người dùng mạng có thể dễ dàng dùng các hệ thống trí tuệ nhân tạo (AI) để tạo ra hình ảnh như mong muốn, nhưng việc này đang có nhiều mặt trái gây lo ngại.
Hình ảnh một con chó với thân vịt được tạo ra bằng Stable Diffusion CHỤP MÀN HÌNH CNN |
Nếu bạn đã từng muốn sử dụng trí tuệ nhân tạo (AI) để nhanh chóng tạo ra hình ảnh một con chó với thân vịt, giờ là lúc để bạn tỏa sáng.
Theo CNN, công ty OpenAI ngày 28.9 thông báo rằng bất kỳ ai cũng có thể sử dụng phiên bản mới nhất của công cụ AI DALL-E của công ty này để tạo ra bất kỳ hình ảnh nào chỉ bằng cách nhập một vài từ.
Động thái này có thể sẽ mở rộng phạm vi tiếp cận của một loạt các công cụ AI mới. Những công cụ trên đã thu hút được nhiều đối tượng sử dụng và thách thức những ý tưởng cơ bản về nghệ thuật và sự sáng tạo của chúng ta. Tuy nhiên, nó cũng có thể làm tăng thêm lo ngại về việc sử dụng sai cách các hệ thống này, một khi chúng được phổ biến rộng rãi.
“Việc học hỏi từ thế giới thực đã cho phép chúng tôi cải thiện các hệ thống an toàn của mình, giúp tăng tính khả dụng”, OpenAI cho biết trong một bài đăng trên blog. Công ty này cũng thông báo đã tăng cường hàng rào để tránh người dùng buộc AI của họ tạo ra “nội dung khiêu dâm, bạo lực và các nội dung khác”.
Hàng triệu người dùng
Hiện có ba hệ thống AI nổi tiếng, vô cùng mạnh mẽ có thể tạo ra một hình ảnh chỉ từ vài từ khóa mà người dùng cung cấp. Ngoài DALL-E 2, hai hệ thống còn lại là Midjourney, được ra mắt vào tháng 7 và Stable Diffusion, được Stability AI phát hành cho công chúng vào tháng 8. Cả ba hệ thống này đều cho người dùng trải nghiệm miễn phí việc tạo ra một vài hình ảnh trực tuyến bằng AI. Sau đó, người dùng phải trả phí nếu muốn sáng tạo thêm.
Những hệ thống sáng tạo bằng AI này đã được sử dụng cho các bộ phim thử nghiệm, bìa tạp chí và quảng cáo bất động sản. Một hình ảnh được Midjourney tạo ra gần đây đã giành chiến thắng trong một cuộc thi nghệ thuật tại Hội chợ bang Colorado, gây ra một cuộc tranh cãi trong giới nghệ sĩ.
Chỉ trong vài tháng, hàng triệu người đã sử dụng các hệ thống AI này. Hơn 2,7 triệu người trong số đó đến từ máy chủ Discord của Midjourney. Trong bài đăng trên blog ngày 28.9, OpenAI cho biết họ có hơn 1,5 triệu người dùng. Những người này đã tạo ra hơn 2 triệu hình ảnh mỗi ngày.
Nhiều hình ảnh được người dùng tạo ra trong những tuần gần đây đã được chia sẻ trực tuyến và gây ấn tượng mạnh. Sự phát triển vượt bậc của công nghệ, những dòng lệnh càng phức tạp và kết quả của chúng đã gây ấn tượng, ngay cả với những người lâu năm trong ngành.
Hình ảnh được tạo ra trên Midjourney với dòng lệnh: Mưa tại TP.HCM trong một buổi chiều hoàng hôn ĐÔNG A |
Ông Andrej Karpathy, người đã từ chức giám đốc AI của Tesla vào tháng 7, gần đây đăng lên Twitter rằng sau khi được mời dùng thử DALL-E 2, ông cảm thấy bối rối vì không biết phải gõ gì và cuối cùng đã gõ từ “con mèo”.
“Trong vài tháng qua, nghệ thuật tạo ra các dòng lệnh đối với các mô hình tạo ra hình ảnh từ văn bản ngày càng được hoàn thiện. Đây là một điều đáng kinh ngạc”, ông Karpathy nhận định.
Mặt trái của AI
Nhưng sự phổ biến của AI đi kèm với những mặt trái tiềm ẩn. Các chuyên gia về AI lo ngại rằng bản chất không giới hạn của các hệ thống này – vốn giúp chúng thành thạo trong việc tạo ra tất cả các loại hình ảnh từ các từ ngữ – và khả năng tự động tạo ảnh khiến chúng có thể tự động tạo ra định kiến trên quy mô lớn.
Vì dụ, khi nhập dòng lệnh “một nhân viên ngân hàng ăn mặc cho một ngày trọng đại tại văn phòng” lên DALL-E 2 vào tuần trước, toàn bộ kết quả là hình ảnh của những người đàn ông da trắng trung niên mặc vest và đeo cà vạt.
“Về cơ bản, họ đang cho phép người dùng tìm ra lỗ hổng trong hệ thống”, bà Julie Carptener, một nhà nghiên cứu và là thành viên của Nhóm Khoa học mới nổi tại Đại học California Polytechnic, San Luis Obispo (Mỹ), cho biết.
Các hệ thống này cũng có khả năng được sử dụng cho các mục đích bất chính như gây ra sự sợ hãi hoặc phát tán thông tin sai lệch qua hình ảnh được chỉnh sửa bằng AI, hoặc hoàn toàn bịa đặt.
Hình ảnh người dùng có thể tạo ra cũng có một số giới hạn. OpenAI yêu cầu người dùng DALL-E 2 đồng ý với chính sách buộc họ không được cố tình tạo ra, tải lên hoặc chia sẻ hình ảnh “không dành cho mọi lứa tuổi hoặc có thể gây hại”. DALL-E 2 cũng sẽ không chạy các dòng lệnh có chứa những từ bị cấm.
Tuy nhiên, người dùng có thể vượt qua rào cản bằng cách thay đổi mô tả của mình. Theo CNN, DALL-E 2 sẽ không xử lý lệnh tạo ra “ảnh một con vịt dính đầy máu”, nhưng nó sẽ trả về hình ảnh cho dòng lệnh “ảnh một con vịt bị dính một chất lỏng màu đỏ sền sệt”.
Ông Chris Gilliard, một nhà nghiên cứu tại Hội đồng Nghiên cứu Khoa học Xã hội (Mỹ), cho rằng các công ty đứng sau những công cụ tạo hình ảnh này đang “đánh giá thấp” “khả năng sáng tạo vô tận” của những người đang tìm cách dùng những công cụ này với mục đích xấu.
“Tôi cảm thấy đây là một ví dụ khác về việc những người phát hành công nghệ còn nửa vời về việc tìm hiểu công nghệ của họ sẽ được sử dụng để gây ra hỗn loạn và gây hại như thế nào. Họ hy vọng rằng sau này có thể sẽ có một số cách để giải quyết những tác hại đó”, ông Gilliard chỉ ra.
Để tránh các vấn đề tiềm ẩn, một số dịch vụ cung cấp hình ảnh trực tuyến đang hoàn toàn cấm hình ảnh AI. Getty Images đã xác nhận với CNN Business vào ngày 28.9 rằng họ sẽ không chấp nhận các hình ảnh được tạo ra bằng các mô hình AI phổ biến và sẽ gỡ bỏ bất kỳ nội dung gửi nào sử dụng các mô hình đó. Quyết định này áp dụng cho các dịch vụ hình ảnh Getty Images, iStock và Unsplash.
“Có những câu hỏi mở liên quan đến bản quyền của sản phẩm các mô hình này tạo ra và có những vấn đề về quyền chưa được giải quyết đối với hình ảnh và siêu dữ liệu cơ bản được sử dụng để đào tạo các mô hình này,” công ty Getty Images tuyên bố.
Tuy nhiên, việc phát hiện và hạn chế những hình ảnh này có thể là một thách thức.
ĐÔNG A
TNO