Nguồn gốc của Grok
Cái tên Grok xuất phát từ tiểu thuyết khoa học viễn tưởng năm 1961 Người lạ ở một vùng đất kỳ lạ Tác giả Robert A. Heinlein. Trong cuốn sách, “Grok” là một từ sao Hỏa có nghĩa là hiểu sâu về một cái gì đó theo cách vượt qua ngôn ngữ, về cơ bản là để nắm bắt một khái niệm đầy đủ và trực giác như thể trở thành một điều với nó.
Elon Musk và Xai có khả năng đã chọn cái tên Grok để phản ánh mục tiêu của AI là hiểu sâu sắc và lý luận về thế giới, thay vì chỉ đáp ứng với thông tin cấp độ bề mặt. Cái tên phù hợp với sứ mệnh của XAI là thúc đẩy sự hiểu biết của AI về vũ trụ.
XAI được thành lập với một nhiệm vụ đã nêu để hiểu bản chất thực sự của vũ trụ. Với Grok, công ty đã đặt ra để tạo ra một mô hình AI cung cấp các phản hồi thông tin và hấp dẫn trong khi tích hợp dữ liệu thời gian thực từ X (trước đây là Twitter). Ra mắt vào tháng 11 năm 2023 với tư cách là một chatbot beta cho người dùng X Premium, Grok được thiết kế để cung cấp câu trả lời sâu sắc, nhận thức theo ngữ cảnh, nhấn mạnh vào lý luận và khả năng thích ứng.
Mặc dù được giới thiệu như một sản phẩm giai đoạn đầu, Grok đã thể hiện sự lặp lại nhanh chóng. Được phát triển chỉ trong hai tháng, giai đoạn beta ban đầu của nó đã đặt nền tảng cho những cải tiến đáng kể, được hỗ trợ bởi một nhóm các nhà nghiên cứu và kỹ sư AI có kinh nghiệm từ Deepmind, Openai và Tesla.
GROK-0 Nguyên mẫu Grok ban đầu
GROK-0, lần lặp đầu tiên của mô hình, có 33 tỷ thông số và thể hiện hiệu suất mạnh mẽ mặc dù được đào tạo với ít tài nguyên hơn so với các đối thủ lớn hơn. Trong các điểm chuẩn như MMLU (câu hỏi đa ngành) và GSM8K (các vấn đề từ toán học), nó thực hiện tương đương với các mô hình có số lượng tham số cao hơn đáng kể, nhấn mạnh sự tập trung của XAI vào hiệu quả và tối ưu hóa.
Grok-1
https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/KRDBJFhnrANiRniSGThGJM.jpg"/>
Vào tháng 10 năm 2023, XAI đã giới thiệu GROK-1, mô hình hỗn hợp tham số 314 tỷ (MOE). Kiến trúc MOE cải thiện hiệu quả bằng cách chỉ kích hoạt một phần tổng số tham số của mô hình cho mỗi nhiệm vụ, khiến chúng có khả năng mở rộng cao. Grok-1 sau đó đã được phát hành dưới dạng một mô hình nguồn mở theo giấy phép Apache 2.0 vào tháng 3 năm 2024, cho phép các nhà phát triển khám phá kiến trúc và khả năng của mình.
Điểm chuẩn đặt Grok-1 trước các mô hình như Meta's Llama 2 (70b) và GPT-3.5 của Openai ở một số khu vực, mặc dù nó vẫn đứng sau các mô hình tiên tiến hơn như GPT-4. Các tính năng kỹ thuật chính bao gồm nhúng vị trí quay (dây thừng) để xử lý trình tự được cải thiện và từ vựng mã thông báo lớn để hỗ trợ các nhiệm vụ ngôn ngữ đa dạng.
GROK-1.5
https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/Uoj5FKnPBJsEhzcArmJBHV.jpg"/>
Tháng 3 năm 2024 đã chứng kiến việc phát hành GROK-1.5, đã đưa ra một chiều dài bối cảnh dài hơn đáng kể là 128.000 mã thông báo lớn hơn 16 lần so với người tiền nhiệm. Sự cải thiện này cho phép các phản ứng dài hạn kết hợp hơn và xử lý tốt hơn các nhiệm vụ lý luận phức tạp, nhiều bước. Ngay sau đó, XAI đã ra mắt GROK-1.5V, kết hợp các khả năng đa phương thức cho phép mô hình phân tích và giải thích hình ảnh cùng với văn bản.
Grok-2
Vào tháng 8 năm 2024, XAI đã phát hành Grok-2 và Grok-2 Mini, cải thiện cả tốc độ xử lý và khả năng lý luận. Điểm chuẩn chỉ ra rằng Grok-2 vượt trội so với các đối thủ cạnh tranh như Claude 3.5 Sonnet và GPT-4 Turbo trong một số nhiệm vụ lý luận và mã hóa. GROK-2 MINI được tối ưu hóa cho hiệu quả, cân bằng tốc độ và độ chính xác cho việc sử dụng đa năng.
Cập nhật thêm vào tháng 12 năm 2024, tốc độ xử lý và độ chính xác của GROK-2 đã tăng cường trong khi mở rộng khả năng đa ngôn ngữ của nó. XAI cũng tích hợp Grok với Aurora, một công cụ tạo hình ảnh do AI hỗ trợ và giới thiệu API doanh nghiệp cho các doanh nghiệp.
GROK-3
https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/Zvak3HAxtVxgDvE4WT2Zwe.jpg"/>
Vào tháng 2 năm 2025, XAI đã ra mắt Grok-3, một gia đình các mô hình được đào tạo sử dụng tài nguyên tính toán lớn hơn đáng kể thông qua Supercluster Colossus (với 200.000 GPU NVIDIA H100). GROK-3 và các biến thể của nó, bao gồm GROK-3 Lý luận và GROK-3 mini, tập trung vào việc cải thiện lý luận logic, giải quyết vấn đề toán học và xử lý dữ liệu thời gian thực.
Điểm chuẩn ban đầu cho thấy GROK-3 vượt trội so với GPT-4O trong các lĩnh vực cụ thể như lý luận toán học (AIME), giải quyết vấn đề khoa học (GPQA) và mã hóa (LiveCodeBench). Các tính năng mới bao gồm nghiên cứu Deep DeepSearch, một công cụ được thiết kế để cung cấp các khả năng nghiên cứu dựa trên web chuyên sâu và chế độ suy nghĩ của người Hồi giáo cho lý luận có cấu trúc hơn.
Kiến trúc AI
Các mô hình của Grok tận dụng các khung AI hiện đại như Kubernetes, Rust và Jax để mở rộng hiệu quả. Kiến trúc MOE vẫn là một điểm khác biệt chính, cho phép XAI tối ưu hóa hiệu suất mà không làm tăng đáng kể chi phí tính toán. Các nguồn dữ liệu đào tạo bao gồm nội dung web có sẵn công khai, các bài đăng X và các bộ dữ liệu có cấu trúc khác.
Khi các mô hình tiếp tục phát triển, độ dài ngữ cảnh đã mở rộng đáng kể, từ 8.192 mã thông báo trong GROK-1 lên 128.000 trong GROK-3, tăng cường khả năng xử lý các tài liệu dài và các cuộc trò chuyện nhiều lượt.
Trải nghiệm người dùng và khả năng truy cập
Grok cung cấp một phong cách đàm thoại độc đáo, thường kết hợp sự hài hước và một giai điệu giản dị trong các phản ứng của nó. Nó hiện có sẵn thông qua X Premium+ ($ 40/tháng hoặc $ 395/năm) với phân phối bổ sung được lên kế hoạch thông qua các ứng dụng độc lập cho iOS và Android. Các tính năng như theo dõi sự kiện thời gian thực, tạo hình ảnh và khả năng tìm kiếm mở rộng cung cấp một loạt các chức năng cho người dùng.
Tuy nhiên, như với bất kỳ mô hình AI nào, những thách thức vẫn còn. Các lần lặp lại sớm của Grok phải đối mặt với những hạn chế về độ chính xác và sự phụ thuộc của nó vào X để cập nhật thời gian thực đã dẫn đến các cuộc thảo luận về các thành kiến tiềm năng trong dữ liệu đào tạo của nó. XAI tiếp tục tinh chỉnh cách tiếp cận của mình, với các kế hoạch cho các lần lặp lại trong tương lai và các bản phát hành nguồn mở bổ sung.
Nhìn về phía trước
https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/hBhUy8t3CJddkWbV6eD8J8.jpg"/>
Elon Musk đã gợi ý về việc tiếp tục mở rộng, bao gồm các mô hình AI của GROK-4 và tương lai tận dụng cơ sở hạ tầng tính toán lớn hơn. XAI cũng đã khám phá các ứng dụng AI trong chơi game và các miền tương tác khác. Mặc dù những cân nhắc về đạo đức như quyền riêng tư, thiên vị và thông tin sai lệch vẫn là trung tâm của các cuộc thảo luận của AI, tốc độ phát triển của XAI cho thấy Grok sẽ vẫn là một người chơi đáng chú ý trong bối cảnh AI đang phát triển.
Với các bản cập nhật và cải tiến liên tục, Grok tiếp tục tự thiết lập như một trợ lý AI đặc biệt, cân bằng quyền truy cập dữ liệu thời gian thực với khả năng lý luận nâng cao. Khi lĩnh vực AI tiến triển, quỹ đạo của Grok sẽ được định hình bởi cả những tiến bộ công nghệ và các cuộc thảo luận rộng hơn về triển khai AI có trách nhiệm.
Thêm từ hướng dẫn của Tom
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.