(KTSG Online) – Hôm 24-2, Meta Platforms, công ty mẹ của Facebook, phát hành mô hình ngôn ngữ lớn mới, có tên gọi LLaMA, phần mềm cốt lõi của một hệ thống trí tuệ nhân tạo (AI) mới. Động thái này càng đốt nóng cuộc chạy đua AI khi các gã khổng lồ công nghệ sốt sắng tích hợp công cụ chatbot AI vào sản phẩm của họ để thu hút người dùng và các nhà đầu tư.
- Microsoft tìm cách ‘chế ngự’ chatbot Bing, phiên bản nâng cao của ChatGPT
- Cơn bùng nổ AI sẽ khiến Google và Microsoft như 'hổ mọc thêm cánh'
Chỉ cung cấp LLaMA cho các nhà nghiên cứu
Cuộc chiến giành quyền thống trị không gian công nghệ AI trỗi dậy vào cuối năm ngoái với việc công ty khởi nghiệp OpenAI (Mỹ), được Microsoft hậu thuẫn, ra mắt chatbot AI tạo sinh ChatGPT và nhanh chóng thu hút 100 triệu người dùng. Cơn sốt này khiến các đối thủ công nghệ khác từ Alphabet (công ty mẹ của Google) cho đến hãng tìm kiếm Baidu của Trung Quốc tung ra các chatbot của riêng họ.
Theo thông báo của Meta Platforms, LLaMA, viết tắt của cụm từ Large Language Model Meta AI, sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện.
Giám đốc điều hành Meta Mark Zuckerberg nói: “LLaMA đã cho thấy rất nhiều hứa hẹn trong việc tạo văn bản, trò chuyện, tóm tắt tài liệu văn bản và các nhiệm vụ phức tạp hơn như giải các định lý toán học hoặc dự đoán cấu trúc protein. Chúng tôi sẽ cung cấp mô hình mới của mình cho cộng đồng nghiên cứu AI”.
Các mô hình ngôn ngữ lớn là các hệ thống AI xử lý khối lượng lớn văn bản kỹ thuật số, từ các bài báo, bài đăng trên phương tiện truyền thông xã hội hoặc các nguồn internet khác. Chúng sử dụng tài liệu bằng văn bản đó để đào tạo phần mềm dự đoán và tự tạo nội dung khi được truy vấn. Các mô hình lớn có thể được sử dụng cho các tác vụ như viết luận, viết tweet, tạo các cuộc hội thoại chatbot và gợi ý mã lập trình máy tính.
Công nghệ này gây sốt đồng thời cũng gây tranh cãi trong những tháng gần đây khi nhiều công ty bắt tung ra các chatbot AI thử nghiệm, vận hành dựa vào mô hình ngôn ngữ lớn. Microsoft đang đầu tư hàng tỉ đô la vào OpenAI và gần đây đã giới thiệu chatbot Bing, phiên bản nâng cao của ChatGPT. Tuy nhiên, chẳng bao lâu sau đó, Microsoft quyết định hạn số lượng câu hỏi trong một ngày và trong mỗi cuộc trò chuyện mà người dùng được phép đưa ra với chatbot Bing vì lo ngại những cuộc trò chuyện dài khiến nó “mất kiểm soát” hoặc “bị kích động” và đưa ra những phản hồi ngoài dự liệu. Nhiều người dùng phàn nàn rằng chatbot Bing sẵn sàng tranh cãi quyết liệt, khăng khăng bảo vệ ý kiến sai, thậm chí phóng tác ra những câu chuyện về bạo lực và “tỏ tình” với họ.
Meta lưu ý vẫn cần nghiên cứu thêm để giải quyết các rủi ro về các thành kiến, nhận xét độc hại và nhận thức giả tạo trong các mô hình ngôn ngữ lớn. Theo Meta, LLaMA sẽ giúp các nhà nghiên cứu cải thiện và khắc phục các vấn đề của các công cụ chatbot AI như đưa ra thông tin độc hại, sai sự thật.
Vượt trội hơn mô hình ngôn ngữ lớn của các đối thủ?
Meta cho biết LLaMA sử dụng công suất điện toán “ít hơn nhiều” so với các mô hinh ngôn ngữ lớn khác. LLaMA được huấn luyện với trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latin và Kirin.
Theo Meta, LLaMA có thể vượt trội so với mô hình ngôn ngữ lớn của các đối thủ vốn có thuật toán cần sử dụng nhiều thông số hơn.
Meta cho rằng phiên bản LLaMA 13 tỉ tham số có thể hoạt động tốt hơn GPT-3, phiên bản tiền thân của mô hình ngôn ngữ lớn được sử dụng để phát triển chatbot ChatGPT.
Meta đánh giá phiên bản LLaMA 65 tỉ tham số có thể “cạnh tranh” với Chinchilla70B và PaLM-540B của Google, hai mô hình thậm chí còn lớn hơn mô hình mà Google đã sử dụng để giới thiệu chatbot Bard gần đây.
Người phát ngôn của Meta cho rằng hiệu suất vượt trội của LLaMA là nhờ lượng dữ liệu “sạch hơn” và “những cải tiến cấu trúc” trong mô hình của nó, giúp nâng cao tính ổn định của quá trình đào tạo.
Hồi tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, nền tảng của chatbot BlenderBot, cũng dành cho các nhà nghiên cứu. Tiếp đó, tập đoàn công nghệ này tiếp tục giới thiệu chatbot AI có tên gọi Galactica, có thể viết các bài báo khoa học và giải các bài toán, nhưng nhanh chóng gỡ bỏ bản demo sau khi nó ra các phản hồi sai.
Gil Luria, nhà phân tích phần mềm cao cấp tại D.A. Davidson, nói: “AI tạo sinh là một ứng dụng mới của AI, lĩnh vực mà Meta có ít kinh nghiệm hơn, nhưng rõ ràng nó rất quan trọng đối với tương lai kinh doanh của tập đoàn công nghệ này”.
AI đang nổi lên như một điểm sáng thu hút các khoản đầu tư vào ngành công nghệ vốn đang trong tình trạng ảm đạm, khiến hàng loạt công nghệ trong ngành sa thải nhân viên hàng loạt và cắt giảm chi phí đầu tư cho các sản phẩm thử nghiệm.
Mark Zuckerberg đã coi AI là ưu tiên hàng đầu trong công ty ông. Trong các cuộc phỏng vấn và họp báo, ông thường nhấn mạnh tầm quan trọng của AI đối với việc cải thiện các sản phẩm của Meta trong. Dù hiện tại, LLaMA không được sử dụng trong các sản phẩm Meta, như Facebook hay Instargram, nhưng có thể mô hình ngôn ngữ lớn này sẽ được tích hợp vào chúng tương lai.
Theo Reuters, Business Insider