(KTSG) - Ở vụ kiện mới đây của The New York Times, liệu OpenAI và Microsoft có vi phạm quyền tác giả hay không khi chỉ sử dụng các tác phẩm đã xuất bản như một nguồn cho việc trả lời các câu hỏi trên chatbot? Và trong trường hợp có xảy ra vi phạm, tương lai nào cho công nghệ AI khi mọi cánh cửa dẫn đến tri thức đều bị từ chối hoặc phải mua với cái giá quá cao?
- New York Times kiện Microsoft và OpenAI, cáo buộc vi phạm bản quyền
- Thắng lợi cho Microsoft khi Sam Altman trở lại ghế CEO của OpenAI
Theo The New York Times (NYT), hàng triệu bài báo của tờ báo đã được sử dụng để đào tạo các chatbot. Vụ kiện được đệ trình lên Tòa án Liên bang ở Manhattan. Mặc dù, vụ kiện chưa bao gồm chính xác số tiền phải bồi thường nhưng họ nói rằng các bị cáo phải chịu trách nhiệm về “hàng tỉ đô la thiệt hại theo luật định và thực tế” liên quan đến việc “sao chép và sử dụng bất hợp pháp các tác phẩm có giá trị độc đáo của NYT”. Bên cạnh đó, tờ báo này cũng kêu gọi các công ty phải hủy bất kỳ mô hình chatbot và dữ liệu đào tạo nào sử dụng tài liệu có bản quyền từ NYT. Trong đơn khiếu nại, NYT cho biết họ đã tiếp cận Microsoft và OpenAI vào tháng 4-2023 để nêu lên những lo ngại về việc sử dụng tài sản trí tuệ của mình nhưng họ nói rằng các cuộc đàm phán đã không thể đưa ra một giải pháp(1).
Phản hồi từ OpenAI và Microsoft
Phát ngôn viên Lindsey Held của OpenAI cho biết trong một tuyên bố rằng công ty đã nỗ lực trong các cuộc trò chuyện với NYT để đạt được giải pháp và vụ kiện khiến họ “ngạc nhiên và thất vọng”. Khác với động thái phản hồi từ OpenAI, Microsoft từ chối bình luận về vụ việc.
Trong một tình tiết gần đây, Microsoft đã trấn an các khách hàng trước những lo ngại về tranh chấp bản quyền đối với các sản phẩm AI của mình. Vào tháng 9, công ty đã thông báo rằng nếu khách hàng sử dụng các công cụ AI của mình bị khiếu nại bản quyền, họ sẽ bồi thường và trang trải các chi phí pháp lý liên quan(2). Bên cạnh đó, họ cũng đã đưa ra nhiều thỏa thuận nhằm đạt được quyền truy cập và sử dụng các tác phẩm có bản quyền. Một số hãng tin đã đạt được thỏa thuận cho việc sử dụng dữ liệu từ các kênh báo chí của họ, như Associated Press đã đạt được thỏa thuận cấp phép vào tháng 7 với OpenAI, và Axel Springer, nhà xuất bản Đức sở hữu Politico và Business Insider, cũng làm như vậy trong tháng 12 vừa qua. Tuy nhiên, các điều khoản cho các thỏa thuận đó không được tiết lộ.
Bản chất công nghệ và pháp lý
Vụ kiện tiếp tục đặt ra những thách thức lớn về ảnh hưởng của công nghệ đối với Luật Sở hữu trí tuệ, đặc biệt là trong lĩnh vực Công nghệ AI tạo sinh (Generative A.I. technologies). Công nghệ này có khả năng tạo ra văn bản, hình ảnh, và nội dung khác sau khi “học” từ các tập dữ liệu lớn. Trong bối cảnh dữ liệu trực tuyến ngày càng đa dạng, từ bài báo đến thơ và kịch bản, các công ty sử dụng AI có thể dễ dàng thu thập, xử lý và tạo ra những tác phẩm mới.
Mặc dù quyền tiếp cận thông tin được coi là một quyền cơ bản của mọi công dân, nhưng việc sử dụng những nguồn tài nguyên này không phải luôn hợp pháp. Để đảm bảo sự cân bằng giữa quyền của tác giả và lợi ích của cộng đồng, pháp luật ở Việt Nam và nhiều quốc gia khác đều đặt ra những quy định giới hạn quyền độc quyền của quyền tác giả. Những quy định này có thể bao gồm việc cho phép cá nhân hoặc tổ chức sử dụng tác phẩm đã được công bố trong một số trường hợp cụ thể mà không cần phải xin phép hoặc trả tiền nhuận bút cho tác giả. Mục tiêu là để đảm bảo rằng quyền lợi của cả tác giả và cộng đồng được đảm bảo một cách hài hòa.
OpenAI và Microsoft đã nói rằng việc sử dụng các tác phẩm có bản quyền để đào tạo các sản phẩm AI là dựa trên nguyên tắc về “sử dụng hợp lý” (fair use). Đây là nguyên tắc có nguồn gốc từ thế kỷ 18, nơi mà Tòa án Anh cho phép việc sử dụng một tác phẩm mà không cần sự cho phép của tác giả. Học thuyết này, còn được biết đến với tên gọi là giao dịch công bằng (fair dealing) trong Vương quốc Anh và các nước thuộc châu Âu lục địa.
Ở Mỹ, nguyên tắc sử dụng hợp lý là một hạn chế đối với quyền độc quyền của chủ sở hữu bản quyền. Theo Luật Bản quyền Mỹ, trong trường hợp vi phạm bản quyền, bị đơn phải chứng minh việc sử dụng hợp lý của họ. Theo đó, điều 107 của luật này đưa ra bốn yếu tố trong việc đánh giá về hành vi có được xem là sử dụng hợp lý hay không:
Trước hết, tòa án sẽ xem xét là mục đích và tính chất của việc sử dụng là thương mại hay giáo dục phi lợi nhuận. Trong trường hợp này, việc sử dụng các bài viết từ NYT, theo thông tin từ thời báo, có vẻ như đã diễn ra với mục đích thương mại.
Thứ hai, tòa án sẽ xem xét bản chất của tác phẩm có bản quyền. Điều này liên quan đến mục đích trong việc khuyến khích sự sáng tạo. Sự sáng tạo và tính độc đáo của tác phẩm sẽ được xem xét, với sự chú ý đặc biệt đối với việc xác định liệu bài viết bị xâm phạm có độ sáng tạo cao hay không. Thường thì, việc sử dụng một tác phẩm giàu trí tưởng tượng (như tiểu thuyết, phim, hay bài hát) có thể được xem xét là ít hợp lý hơn so với sự sử dụng của một tác phẩm thực tế (như một bài báo kỹ thuật hay tin tức).
Thứ ba, tòa án sẽ xem xét cả số lượng và chất lượng của tài liệu có bản quyền đã được sử dụng. Nếu việc sử dụng bao gồm một phần lớn tác phẩm có bản quyền, việc sử dụng đó có khả năng là không hợp lý. Thậm chí một lượng nhỏ tác phẩm có bản quyền cũng có thể được xem xét là không hợp lý nếu nó đặt ra một phần quan trọng hoặc “trái tim” của tác phẩm. Trong vụ kiện Harper & Row Publishers(3), mặc dù bị cáo (the Nation magazine) chỉ trích dẫn 300 từ trong cuốn hồi ký 200.000 từ của Tổng thống Ford, Tòa án Tối cao đã cho rằng phần được trích dẫn là “...trái tim của cuốn sách” và đưa ra phán quyết chống lại bị cáo. Như thông tin thời báo đưa ra trong cách các hệ thống AI sử dụng bài báo của mình, một tính năng tìm kiếm của Microsoft được cung cấp bởi ChatGPT có tên là Browse With Bing đã sao chép gần như nguyên văn kết quả từ Wirecutter, trang web đánh giá sản phẩm của NYT.
Cuối cùng, tòa án sẽ xem xét liệu việc sử dụng không phép có gây thiệt hại cho chủ sở hữu bản quyền hay không. Trong vụ Basic Books kiện Kinko’s Graphics Corp., tòa án đã quyết định rằng việc sao chép và bán các gói khóa học có thể ngăn chặn nhu cầu mua sách giáo khoa đầy đủ, do đó làm tổn hại đến bản gốc của tác giả. Trong vụ NYT kiện OpenAI, một thiệt hại tiềm tàng đối với thương hiệu của NYT được đưa ra là việc chatbot đưa ra thông tin sai lệch, gây nhầm lẫn cho người đọc. Đơn khiếu nại trích dẫn một số trường hợp trong đó Bing Chat của Microsoft cung cấp thông tin không chính xác được cho là đến từ NYT. Điều này có thể dẫn đến nguy cơ giảm lưu lượng truy cập vào các bài báo của Wirecutter và mất doanh thu cho Wirecutter.
Có lẽ cần phải chờ đợi thêm những gì mà các bên đưa ra mới có thể xác định được kết cục của vụ kiện này. Tuy nhiên, có lẽ rằng một thỏa thuận sẽ được đưa ra với mức bồi thường cao từ phía OpenAI và Microsoft cho NYT là có cơ sở!?
Vòng bảo hộ sẽ bị xoá bỏ?
Những vụ kiện như trên cho thấy ranh giới bảo hộ quyền tác giả liên tục bị thách thức vào những thời điểm công nghệ có những tiến bộ vượt bậc. Các công ty công nghệ sẽ tiếp tục “vận động” nhằm chống lại và nới rộng vòng bảo hộ quyền tác giả dựa trên cơ sở tiếp cận thông tin hợp lý của mình. Trong khi đó, ở phía ngược lại, việc cho phép truy cập dựa trên nguyên tắc sử dụng hợp lý sau đó xử lý vào mục đích thương mại bị cho là một dấu chấm hết cho sự sáng tạo của con người. Khi đó, các tác phẩm được sản xuất ít hơn và lợi ích cho xã hội sẽ giảm đi một cách đáng kể.
Những tranh luận về hoạt động của AI chắc chắn sẽ nhiều hơn trong thời gian tới. Tuy nhiên, nếu trường hợp nếu như những công ty công nghệ này tiếp tục phải bồi thường thiệt hại quá nhiều, hoặc các thỏa thuận của họ với các chủ sở hữu tác phẩm bị đẩy lên quá cao, liệu có còn những sự đầu tư tiếp theo cho thời đại mới hay không?
(*) Giảng viên Khoa luật Dân sự, trường Đại học Luật, Đại học Huế.
(1) https://www.nytimes.com/2023/12/27/business/media/new-york-times-open-ai-microsoft-lawsuit.html> Truy cập: 28-12-2023
(2) https://www.reuters.com/technology/microsoft-defend-customers-ai-copyright-challenges-2023-09-07/
(3) Harper & Row v. Nation Enterprises, 471 U.S. 539 (1985)