
Llama 3: Mô hình AI miễn phí của Meta đối đầu với các đối thủ trả phí
Dù Llama 3 được Meta Platforms phát hành miễn phí, nó vẫn có khả năng xử lý đa ngôn ngữ và mang lại hiệu suất tổng thể không kém gì so với các mô hình trả phí của OpenAI hoặc Anthropic.
Với 405 tỷ tham số hoặc biến mà thuật toán xem xét để tạo ra phản hồi cho câu hỏi của người dùng, phiên bản mới của Llama 3 vượt xa phiên bản trước do Meta phát hành năm ngoái. Tuy nhiên, nó vẫn nhỏ hơn các mô hình AI hàng đầu từ các đối thủ cạnh tranh như GPT-4 của OpenAI, có 1.000 tỷ tham số hoặc mô hình 2.000 tỷ tham số mà Amazon đang đầu tư vào.
Ngoài mẫu Llama 3 có 405 tỷ tham số, Meta còn tung ra các phiên bản cập nhật nhẹ hơn với 8 tỷ và 70 tỷ tham số, được giới thiệu vào mùa xuân.
Ba mô hình AI mới của Meta đều hỗ trợ đa ngôn ngữ, cho phép xử lý các yêu cầu phức tạp hơn từ người dùng nhờ vào “cửa sổ ngữ cảnh” được mở rộng, đồng thời cải thiện trải nghiệm trong việc tạo mã máy tính tùy chỉnh.
Cửa sổ ngữ cảnh, hay còn gọi là bộ nhớ dài, là một phương pháp được áp dụng trong các mô hình ngôn ngữ lớn như Llama 3. Kỹ thuật này hỗ trợ mô hình trong việc xử lý những yêu cầu phức tạp và cung cấp các phản hồi chính xác hơn.
Cửa sổ ngữ cảnh hoạt động bằng cách cho phép mô hình AI xem xét một khối lượng lớn văn bản cả trước và sau câu hỏi của người dùng. Điều này giúp mô hình nắm bắt tốt hơn bối cảnh của truy vấn và từ đó tạo ra những phản hồi phù hợp hơn.
“Đó là phản hồi chính mà chúng tôi đã nhận từ cộng đồng.” – Reuters trích dẫn lời Ahmad Al-Dahle, người đứng đầu bộ phận AI tạo sinh tại Meta Platforms, lưu ý rằng các cửa sổ ngữ cảnh lớn hơn cung cấp cho các mô hình có yêu cầu nhiều bước.

Mô hình trí tuệ nhân tạo (AI) Llama 3 của Meta có nhiều tính năng nổi bật mặc dù miễn phí. Ảnh: Reuters
Mặc dù tốc độ phát triển AI khó có thể đo lường, nhưng kết quả thử nghiệm do Meta cung cấp dường như cho thấy mô hình Llama 3 ngang bằng, và trong một số trường hợp còn vượt trội hơn, Claude 3.5 Sonnet của Anthropic và GPT-4o của OpenAI.
Ví dụ, trên chuẩn TOÁN của các bài toán cấp độ thi đấu, phiên bản lớn nhất của Llama 3 đạt 73,8 điểm, so với 76,6 điểm của GPT-4o và 71,1 điểm của Claude 3.5 Sonnet.
Phiên bản Llama 3 lớn nhất đạt 88,6 điểm trong bài kiểm tra MMLU (chuẩn mực bao gồm hàng chục môn toán, khoa học và nhân văn), trong khi GPT-4o đạt 88,7 điểm và Claude 3.5 Sonnet đạt 88,3 điểm.
Claude 3.5 Sonnet và GPT-4o được coi là hai mô hình AI tiên tiến mạnh mẽ nhất trên thị trường hiện nay.
Meta cũng giới thiệu các phiên bản “đa phương thức” của các mô hình AI dự kiến sẽ ra mắt vào cuối năm nay, bổ sung khả năng hình ảnh, video và giọng nói vào mô hình cốt lõi Llama 3. Công ty cho biết các thử nghiệm ban đầu cho thấy các mô hình AI này có khả năng cạnh tranh với các mô hình đa phương thức khác như Gemini 1.5 của Google và Claude 3.5 Sonnet của Anthropic.
Thông qua việc phát hành miễn phí mô hình Llama 3, CEO Mark Zuckerberg kỳ vọng rằng Meta sẽ gặt hái được lợi ích từ những sản phẩm sáng tạo và sự tương tác tăng cao trên các nền tảng mạng xã hội chính của công ty. Mong muốn của tỷ phú này cũng nhằm mục tiêu giúp các phiên bản Llama vượt qua các đối thủ cạnh tranh trong năm tới.
Meta cũng có thể được hưởng lợi nếu các nhà phát triển chọn sử dụng các mô hình AI miễn phí thay vì mô hình trả phí, vì điều này sẽ làm suy yếu các mô hình AI của đối thủ cạnh tranh.
Tuy nhiên, một số nhà đầu tư nghi ngờ rằng sẽ có chi phí phát sinh thay vì việc sử dụng Llama 3 hoàn toàn miễn phí.
>>> Xem thêm: VinBigdata: Khẳng định vị thế AI của Việt Nam trên bản đồ công nghệ thế giới