AI Agents, RAG và LLMs

AI Agents, RAG và LLMs:

1. Mô hình cơ sở DeepSeek V3 cho thấy hiệu suất ấn tượng

• Mô hình Mixture-of-Experts với 671 tỷ tham số

• 37 tỷ tham số được kích hoạt mỗi token

• Vượt trội hơn Claude 3.5 Sonnet, GPT-4 và Llama 3

2. OASIS ra mắt trình mô phỏng mạng xã hội

• Mô hình hỗ trợ lên tới 1 triệu tương tác của các AI agent

• Nghiên cứu hành vi trên Twitter và Reddit

• Phân tích sự lan truyền thông tin và động lực nhóm

3. Cheshire Cat AI là một khung mã nguồn mở cho các AI agent sản xuất

• Được xây dựng với Docker làm cốt lõi

• Xử lý tài liệu và kết nối với các API bên ngoài

• Hỗ trợ cả LLMs thương mại và mã nguồn mở

4. Humanloop phát hành bộ đánh giá RAG toàn diện

• Đánh giá tự động thông qua mã code hoặc giao diện người dùng

• Khả năng thu thập phản hồi của con người

• Giám sát hiệu suất thời gian thực

5. Hercules xuất hiện như là agent kiểm thử mã nguồn mở đầu tiên

• Chuyển đổi các bước Gherkin thành các bài kiểm thử end-to-end

• Không yêu cầu kỹ năng lập trình

• Xử lý tự động hóa kiểm thử phức tạp