Nhà điều hành OpenAI có thể lướt web giúp bạn

OpenAI đã bắt đầu xem trước một công cụ mới có tên Toán tử có thể điều hướng trong trình duyệt web. Theo một bài đăng trên blog được xuất bản hôm thứ Năm, phần mềm này được cung cấp bởi cái mà công ty gọi là Tác nhân sử dụng máy tính. OpenAI về mô hình cho biết: “CUA được đào tạo để tương tác với giao diện đồ họa người dùng (GUI) – các nút, menu và trường văn bản mà mọi người nhìn thấy trên màn hình – giống như con người vẫn làm”. “Điều này mang lại cho nó sự linh hoạt để thực hiện các tác vụ kỹ thuật số mà không cần sử dụng API dành riêng cho hệ điều hành hoặc web.”

Bản phát hành hiện tại của Operator được xây dựng trên mô hình GPT-4o của OpenAI. Nó kết hợp khả năng thị giác của thuật toán đó với “lý luận nâng cao” được đào tạo thông qua học tập tăng cường. Người vận hành có khả năng “chia nhiệm vụ thành các kế hoạch gồm nhiều bước và tự điều chỉnh một cách thích ứng khi có thách thức”. Theo OpenAI, khả năng đó thể hiện giai đoạn tiếp theo trong quá trình phát triển AI.

Nhà điều hành có thể tương tác với nhiều trang web khác nhau, bao gồm cả nền tảng đặt hàng của Instacart.  Nhà điều hành có thể tương tác với nhiều trang web khác nhau, bao gồm cả nền tảng đặt hàng của Instacart.

Instacart

Giống như các bản xem trước nghiên cứu trước đây, OpenAI cảnh báo rằng Operator “vẫn còn sớm và có những hạn chế” và nó sẽ “chưa hoạt động đáng tin cậy trong mọi tình huống”. Ví dụ: tùy thuộc vào mức độ phức tạp của nhiệm vụ và giao diện liên quan, tác nhân sẽ được hưởng lợi rất nhiều khi người dùng dành thêm một chút thời gian để viết lời nhắc chi tiết hơn. mỗi The VergeNgười vận hành sẽ cung cấp cho người dùng quyền kiểm soát nếu họ gặp khó khăn trong một nhiệm vụ. Nó cũng sẽ trao quyền kiểm soát bất cứ khi nào một trang web yêu cầu thông tin nhạy cảm, bao gồm cả thông tin đăng nhập. Công ty cho biết họ đã thiết kế công cụ này để “từ chối các yêu cầu có hại và chặn nội dung không được phép”.

OpenAI lần đầu tiên cung cấp Nhà điều hành cho người dùng với gói đăng ký ChatGPT Pro trị giá 200 USD mỗi tháng. Nó cũng hợp tác với các công ty như Instacart để cung cấp đại lý trên nền tảng của họ, mặc dù ở đó, bạn sẽ cần đăng ký ChatGPT Pro để kiểm tra khả năng tích hợp.

Nhà điều hành tham gia vào danh sách ngày càng nhiều các tác nhân AI có thể điều hướng trình duyệt web hoặc toàn bộ hệ điều hành. Anthropic là công ty đầu tiên cung cấp khả năng này khi phát hành mẫu Claude 3.5 Sonnet vào tháng 10, gần đây là Google với mẫu Gemini 2.0 và Project Mariner.

Nếu bạn mua thứ gì đó thông qua liên kết trong bài viết này, chúng tôi có thể kiếm được hoa hồng.


Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.

Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký ngay để tiếp tục đọc và truy cập kho lưu trữ đầy đủ.

Tiếp tục đọc