Không có nghi ngờ gì về điều đó, Deepseek R1 là một rất. To lớn. Thỏa thuận. Có rất nhiều sự cường điệu trong kinh doanh AI, cũng như cách với hầu hết các công nghệ mới. Nhưng đôi khi, một người mới đến thực sự có một yêu cầu thực sự là một lực lượng gây rối lớn. Deepseek R1 là một sinh vật như vậy (bạn có thể truy cập mô hình cho chính mình ở đây).
Trên mặt của nó, nó chỉ là một mô hình AI mới của Trung Quốc và không thiếu những thứ này ra mắt mỗi tuần. Nhưng có hai điều chính làm cho Deepseek R1 khác nhau.
Đầu tiên, mọi người đang nói về nó có hiệu suất giống như mô hình O1 của Openai. Tóm lại, O1 là nhà lãnh đạo thế giới hiện tại trong các mô hình AI, vì khả năng lý luận của nó trước khi đưa ra câu trả lời. Điều này làm cho nó cực kỳ mạnh mẽ cho các nhiệm vụ phức tạp hơn, mà AI thường phải vật lộn.
Việc một người mới đến đã nhảy vào sự tranh chấp với người dẫn đầu thị trường trong một lần là đáng kinh ngạc.
Việc một người mới đến đã nhảy vào sự tranh chấp với người dẫn đầu thị trường trong một lần là đáng kinh ngạc.
Thứ hai, không chỉ mô hình mới này cung cấp hiệu suất gần như giống như mô hình O1 mà còn là nguồn mở. Điều này có nghĩa là bất kỳ nhà nghiên cứu hoặc kỹ sư AI nào trên khắp thế giới đều có thể làm việc để cải thiện và tinh chỉnh nó cho các ứng dụng khác nhau.
Đó là một bước nhảy vọt về tốc độ phát triển tiềm năng mà chúng ta có thể thấy trong AI trong những tháng tới. Đây không còn là tình huống mà một hoặc hai công ty kiểm soát không gian AI, giờ đây có một cộng đồng toàn cầu khổng lồ có thể đóng góp cho sự tiến bộ của các công cụ mới tuyệt vời này.
Để thêm sự xúc phạm đến thương tích, gia đình người mẫu Deepseek đã được đào tạo và phát triển chỉ sau hai tháng với 5,6 triệu đô la. Điều này so với chi phí phát triển tỷ đô của những người đương nhiệm chính như Openai và Anthropic.
Nói rằng đó là một cái tát vào mặt các gã khổng lồ công nghệ này là một cách nói nhẹ nhàng. Các chủ sở hữu quỹ phòng hộ của Trung Quốc của Deepseek, High Flyer, có một hồ sơ theo dõi trong sự phát triển của AI, vì vậy đó không phải là một bất ngờ hoàn toàn. Điều bất ngờ là họ đã tạo ra một cái gì đó từ đầu rất nhanh và với giá rẻ, và không có lợi ích của việc tiếp cận với công nghệ máy tính phương Tây.

Xem trên
Tất nhiên xếp hạng tốt trên một điểm chuẩn là một điều, nhưng hầu hết mọi người hiện đang tìm kiếm bằng chứng trong thế giới thực về cách các mô hình thực hiện trên cơ sở hàng ngày. Các báo cáo ban đầu cho thấy rằng các điểm chuẩn DeepSeek không nói dối, với một số người dùng áp dụng nó để lập trình AI theo sở thích đối với Claude Sonnet 3.5 của Anthropic.
Đáng ngạc nhiên là mô hình R1 thậm chí dường như di chuyển các mục tiêu trên các hoạt động sáng tạo hơn. Một người dùng Reddit đã đăng một mẫu của một số văn bản sáng tạo được sản xuất bởi mô hình, rất tốt.
Những ngày đầu
https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ-480-80.png 480w, https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ-650-80.png 650w, https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ-970-80.png 970w, https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ-1024-80.png 1024w, https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ-1200-80.png 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ.png" data-pin-media="https://cdn.mos.cms.futurecdn.net/TLdLpvBT6hJJvzr597WeeZ.png"/>
Thử nghiệm của riêng tôi cho thấy Deepseek cũng sẽ phổ biến cho những người muốn sử dụng nó tại địa phương trên máy tính của riêng họ. Trong ba bài kiểm tra nhỏ, không được thừa nhận, tôi đã làm với mô hình mà tôi đã bị cúi đầu vì nó đã làm tốt như thế nào.
Trong một thử nghiệm, tôi đã yêu cầu mô hình giúp tôi theo dõi một tên nền tảng gây quỹ phi lợi nhuận mà tôi đang tìm kiếm. Một tìm kiếm tiêu chuẩn của Google, Openai và Gemini đều không cho tôi bất cứ nơi nào gần câu trả lời đúng. Deepseek đánh nó trong một lần, điều đó thật đáng kinh ngạc.
Chúng tôi đang sống trong một dòng thời gian nơi một công ty không phải là Hoa Kỳ đang giữ nhiệm vụ ban đầu của Openai sống – thực sự cởi mở, nghiên cứu biên giới trao quyền cho tất cả. Nó không có ý nghĩa. Kết quả giải trí nhất là khả năng nhất.Deepseek-r1 không chỉ nguồn mở một loạt các mô hình mà còn là pic pic.twitter.com/m7eznemcoyNgày 20 tháng 1 năm 2025
Đó là những ngày đầu để vượt qua phán đoán cuối cùng về mô hình AI mới này, nhưng kết quả cho đến nay dường như rất hứa hẹn. Một điều tôi đã nhận thấy, là việc nhắc nhở và lời nhắc hệ thống cực kỳ quan trọng khi chạy mô hình cục bộ.
Nếu không có lời nhắc tốt, kết quả chắc chắn là tầm thường, hoặc ít nhất là không có tiến bộ thực sự so với các mô hình địa phương hiện có. Nhưng khi nó làm cho đúng, lòng tốt của tôi, tia lửa chắc chắn bay.
Thêm từ hướng dẫn của Tom
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.