Tiểu thuyết gia 'nổi dậy' phản đối AI, kêu gọi chấm dứt thời đại nội dung miễn phí

17/7/2023 Gốc

Trong hơn 20 năm, Kit Loffstadt đã viết tiểu thuyết về các vũ trụ song song trong 'Chiến tranh giữa các vì sao', nhân vật phản diện 'Buffy the Vampire Slayer' và chia sẻ những tiểu thuyết này miễn phí trực tuyến.

Nhưng vào tháng 5, cô đã ngừng đăng các tác phẩm của mình sau khi biết rằng một công ty dữ liệu đã sao chép các câu chuyện của cô và đưa chúng vào công nghệ trí tuệ nhân tạo làm nền tảng cho ChatGPT.

Tác giả tiểu thuyết trực tuyến Kit Loffstadt. Ảnh: NYT

Cuộc "nổi dậy" cần thiết

Loffstadt cũng đã giúp tổ chức một hoạt động "nổi dậy" vào tháng trước chống lại AI. Cùng với hàng chục nhà văn viết tiểu thuyết khác, cô đã xuất bản một loạt các câu chuyện "tào lao" trên mạng để gây nhầm lẫn cho các dịch vụ thu thập dữ liệu.

Loffstadt, một diễn viên lồng tiếng 42 tuổi đến từ Nam Yorkshire, Anh cho biết: “Mỗi người chúng tôi phải làm bất cứ điều gì có thể để cho họ thấy sản phẩm sáng tạo của chúng tôi không thể bị máy móc thu thập một cách tùy ý".

Các tác giả tiểu thuyết chỉ là một nhóm hiện đang tổ chức các cuộc nổi dậy chống lại hệ thống AI. Trong những tháng gần đây, các công ty truyền thông xã hội như Reddit và Twitter, các tổ chức tin tức bao gồm The New York Times và NBC News, các tác giả như Paul Tremblay và nữ diễn viên Sarah Silverman đều có quan điểm chống lại việc AI thu thập dữ liệu một cách trái phép.

Các cuộc biểu tình của họ đã diễn ra dưới nhiều hình thức khác nhau. Các nhà văn và nghệ sĩ đang khóa các tác phẩm của họ hoặc đang tẩy chay một số trang web xuất bản nội dung do AI tạo ra, trong khi các công ty như Reddit muốn tính phí truy cập vào dữ liệu của họ.

Ít nhất 10 vụ kiện đã được đệ trình trong năm nay chống lại các công ty AI, cáo buộc các công ty này đào tạo hệ thống dựa trên các tác phẩm sáng tạo của các nghệ sĩ mà chưa có sự đồng ý của tác giả. Tuần trước, bà Silverman cùng các tác giả Christopher Golden và Richard Kadrey đã kiện OpenAI, nhà sản xuất ChatGPT và những người khác về việc để chatbot này sử dụng tác phẩm của họ.

Các cuộc nổi loạn đang cho thấy rằng thông tin trực tuyến, bao gồm các câu chuyện, tác phẩm nghệ thuật, các bài báo và ảnh có thể có giá trị đáng kể chưa được khai thác.

Việc sử dụng các mô hình ngôn ngữ lớn để lập trình AI khiến các công ty công nghệ cực kỳ "đói" dữ liệu. Google, Meta và OpenAI về cơ bản đã sử dụng thông tin từ khắp nơi trên internet, bao gồm cơ sở dữ liệu lớn về tiểu thuyết trực tuyến, các bài báo và tuyển tập sách, những thứ có sẵn trên mạng một cách miễn phí.

GPT-3 của OpenAI, một hệ thống AI được phát hành vào năm 2020, bao gồm 500 tỷ “mã thông báo”, mỗi mã đại diện cho các phần của từ được tìm thấy chủ yếu trên mạng. Một số mô hình AI khác có hơn một nghìn tỷ mã thông báo.

Hoạt động thu thập dữ liệu trên internet đã có từ lâu. Nhưng nó không được các công ty sở hữu dữ liệu coi là vấn đề đặc biệt. Điều này đã thay đổi sau khi ChatGPT ra mắt vào tháng 11 và công chúng đã biết thêm về các chatbot.

Ông Brandon Duderstadt, người sáng lập và giám đốc điều hành của Nomic, một công ty AI cho biết: “Trước đây, người ta thường nghĩ rằng bạn nhận được giá trị từ dữ liệu bằng cách cung cấp dữ liệu cho mọi người và chạy quảng cáo. Bây giờ, các thông tin có nhiều giá trị hơn khi sử dụng làm đầu vào cho AI, và vì thế mọi người đang khóa các dữ liệu trên mạng".

Thời đại nội dung miễn phí sắp kết thúc

Những gã khổng lồ công nghệ giàu có như Google và Microsoft đã ngồi trên hàng núi thông tin độc quyền và có đủ nguồn lực để truy cập nhiều dữ liệu hơn. Nhưng khi thời đại của nội dung miễn phí trực tuyến sắp kết thúc, các công ty AI mới thành lập và phi lợi nhuận từng hy vọng cạnh tranh với các công ty lớn có thể không có đủ nội dung để đào tạo hệ thống của họ.

Trong một tuyên bố, OpenAI cho biết ChatGPT đã được đào tạo về “nội dung được cấp phép, nội dung có sẵn công khai và nội dung do con người cung cấp”.

“Chúng tôi tôn trọng quyền của người sáng tạo và tác giả đồng thời mong muốn tiếp tục hợp tác với họ để bảo vệ lợi ích của các tác giả", thông cáo nói thêm.

Google cho biết trong một tuyên bố rằng họ đã tham gia vào các cuộc thảo luận về cách các nhà xuất bản có thể quản lý nội dung của họ trong tương lai. “Chúng tôi tin rằng mọi người đều được hưởng lợi từ một hệ sinh thái nội dung sôi động", công ty cho biết. Microsoft đã không trả lời yêu cầu bình luận.

Hoàng Tôn (theo NYT)

Nguồn Công Luận: https://congluan.vn/tieu-thuyet-gia-noi-day-phan-doi-ai-keu-goi-cham-dut-thoi-dai-noi-dung-mien-phi-post256533.html