AI Agents, RAG và LLMs:
1. Mô hình cơ sở DeepSeek V3 cho thấy hiệu suất ấn tượng
• Mô hình Mixture-of-Experts với 671 tỷ tham số
• 37 tỷ tham số được kích hoạt mỗi token
• Vượt trội hơn Claude 3.5 Sonnet, GPT-4 và Llama 3
2. OASIS ra mắt trình mô phỏng mạng xã hội
• Mô hình hỗ trợ lên tới 1 triệu tương tác của các AI agent
• Nghiên cứu hành vi trên Twitter và Reddit
• Phân tích sự lan truyền thông tin và động lực nhóm
3. Cheshire Cat AI là một khung mã nguồn mở cho các AI agent sản xuất
• Được xây dựng với Docker làm cốt lõi
• Xử lý tài liệu và kết nối với các API bên ngoài
• Hỗ trợ cả LLMs thương mại và mã nguồn mở
4. Humanloop phát hành bộ đánh giá RAG toàn diện
• Đánh giá tự động thông qua mã code hoặc giao diện người dùng
• Khả năng thu thập phản hồi của con người
• Giám sát hiệu suất thời gian thực
5. Hercules xuất hiện như là agent kiểm thử mã nguồn mở đầu tiên
• Chuyển đổi các bước Gherkin thành các bài kiểm thử end-to-end
• Không yêu cầu kỹ năng lập trình
• Xử lý tự động hóa kiểm thử phức tạp