(KTSG Online) – OpenAI, nhà phát triển ChatGPT khẳng định đã phát hiện ra bằng chứng cho thấy, công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek của Trung Quốc sử dụng các mô hình độc quyền của OpenAI để đào tạo 2 mô hình AI là V3 và R1. Điều đó giúp DeepSeek tiết kiệm đáng kể chi phí đào tạo và và vận hành các mô hình này.
- Cổ phiếu công nghệ chao đảo vì mô hình AI giá rẻ của Trung Quốc
- Các tỉ phú Trung Quốc phát động cuộc đua AI với Mỹ
Trao đổi với tờ Financial Times, OpenAI có trụ sở tại San Francisco (Mỹ) cho biết đã thấy một số bằng chứng về việc DeepSeek “chưng cất” kiến thức từ các mô hình AI của công ty này. “Chưng cất” là một kỹ thuật được các nhà phát triển sử dụng để có hiệu suất tốt hơn trên các mô hình AI nhỏ hơn bằng cách sử dụng kết quả từ các mô hình lớn hơn, có năng lực hơn. Điều này cho phép các mô hình AI nhỏ đạt được kết quả tương tự cho các nhiệm vụ cụ thể với chi phí thấp hơn nhiều.
OpenAI từ chối bình luận chi tiết về bằng chứng nói trên. Tuy nhiên, điều khoản dịch vụ của công ty nêu rõ người dùng không được “sao chép” bất kỳ dịch vụ nào của công ty hoặc “sử dụng dữ liệu đầu ra để phát triển các mô hình cạnh tranh với OpenAI”.
Trước đó, hãng tin Bloomberg dẫn một nguồn thạo tin cho biết Sam Altman, CEO OpenAI nói với nhân viên rằng công ty đang cố gắng tìm hiểu xem năng lực của DeepSeek có phải là kết quả của việc chắt lọc các mô hình của OpenAI hay không.
OpenAI và Tập đoàn Microsoft, nhà đầu tư lớn của OpenAI, đang điều tra xem liệu dữ liệu đầu ra từ công nghệ của OpenAI có bị một nhóm có liên hệ với DeepSeek lấy cắp một cách trái phép hay không.
Việc DeepSeek ra mắt mô hình AI lý luận R1, với hiệu suất ấn tượng trong các nhiệm vụ nhận thức, đã gây sốc cho thị trường cũng như nhà đầu tư và các tập đoàn công nghệ ở Thung lũng Silicon. Mô hình R1 đạt được thứ hạng cao trong các bảng đánh giá hiệu suất của chatbot, tương đương với các mô hình AI hàng đầu của Mỹ
Một nguồn tin gần gũi với OpenAI cho biết, “chưng cất” là một hoạt động phổ biến trong ngành và nhấn mạnh OpenAI cung cấp cho các nhà phát triển một cách để thực hiện việc này bằng nền tảng riêng, “Vấn đề là bạn thực hiện điều đó để tạo mô hình riêng cho mục đích của riêng bạn”, nguồn tin nói.
Trước đó, người đứng đầu AI và tiền điện tử của Nhà Trắng David Sacks nói rằng “có khả năng” DeepSeek đã vi phạm bản quyền sở hữu trí tuệ của OpenAI.
“Có một kỹ thuật trong AI gọi là chưng cất khi một mô hình học hỏi và lấy đi kiến thức từ một mô hình khác”, Sacks nói trong cuộc trả lời phỏng vấn với hãng tin Fox News hôm 28-1.
Ông nói thêm rằng, có bằng chứng đáng kể cho thấy DeepSeek chắt lọc kiến thức từ các mô hình OpenAI.
Sacks khen ngợi khả năng tạo ra mô hình hiệu quả của DeepSeek mà không cần dựa vào nhiều GPU tiên tiến. Nhưng ông tin rằng cơn sốt liên quan đến DeepSeek sẽ thúc đẩy các công ty AI của Mỹ thực hiện các biện pháp để ngăn chặn kỹ thuật “chưng cất” để hạn chế sự phát triển của các mô hình “sao chép”.
DeepSeek cho biết chỉ sử dụng 2.048 card đồ họa (GPU) H800 của Nvidia và 5,6 triệu đô la để đào tạo mô hình DeepSeek-V3 (phiên bản tiền nhiệm của R1) với 671 tỉ tham số. Con số này chỉ bằng một phần nhỏ so với số tiền mà OpenAI và Google đã chi để đào tạo các mô hình có quy mô tương đương.
Theo một số chuyên gia, cách mô hình R1 của DeepSeek tạo ra các phản hồi cho thấy nó được đào tạo dựa trên kết quả từ mô hình GPT-4 của OpenAI. Điều này vi phạm các điều khoản dịch vụ của OpenAI.
Các chuyên gia trong ngành cho biết, trên thực tế, các phòng thí nghiệm AI ở cả Trung Quốc lẫn Mỹ thường sử dụng kết quả đào tạo mô hình của các công ty AI hàng đầu như OpenAI.
Những công ty dẫn đầu ngành như OpenAI đã đầu tư vào việc hướng dẫn mô hình tạo ra phản hồi giống con người. Khoản đầu tư này rất tốn kém và đòi hỏi nhiều nhân lực.
"Các công ty khởi nghiệp và nhà nghiên cứu thường sử dụng kết quả từ các chương trình ngôn ngữ lớn (LLM) phản hồi giống con người như ChatGPT để đào tạo một mô hình khác. Điều đó có nghĩa là họ tiếp thu phản hồi mang tính con người này miễn phí. Tôi không ngạc nhiên khi DeepSeek được cho là sẽ làm điều tương tự. Nếu vậy, việc ngăn chặn triệt để hành vi này có thể sẽ rất khó khan”, Ritwik Gupta, nghiên cứu sinh tiến sĩ chuyên ngành AI tại Đại học California ở Berkeley nói.
Thực tế này cũng chỉ ra một vấn đề tài chính mới nổi đối với các công ty tiên phong thực hiện nghiên cứu tiên tiến về AI về cách bảo vệ lợi thế kỹ thuật khi các công ty khác có thể khai thác mô hình của họ.
Các công ty AI của Trung Quốc đã nhanh chóng tiếp thu bài học từ các đối thủ ở Mỹ trong khi đổi mới phương pháp đào tạo để tối ưu hóa số lượng chip hạn chế, giúp việc đào tạo và vận hành các mô hình trở nên rẻ hơn.
“Chúng tôi biết các công ty có trụ sở tại Trung Quốc và nhiều công ty khác đang liên tục cố gắng sao chép mô hình của các công ty AI hàng đầu tại Mỹ’, OpenAI cho biết thêm trong một tuyên bố
OpenAI hiện cũng đối mặt với cáo buộc vi phạm bản quyền từ các tờ báo và nhà sáng tạo nội dung, bao gồm các vụ kiện từ tờ The New York Times và các nhà văn nổi tiếng, cáo buộc công ty đào tạo mô hình dựa trên các bài viết và sách của họ khi chưa được phép.
Theo Financial Times, Bloomberg