Với tham vọng của Metaverse đang bị xáo trộn, Meta hiện đang tìm kiếm AI để cung cấp năng lượng cho giai đoạn phát triển tiếp theo của mình. Một trong những dự án mới nhất của Meta được gọi là Mô hình phân đoạn bất cứ thứ gì, gã khổng lồ truyền thông xã hội đã công bố hôm thứ Tư.
Segment Anything giúp người dùng xác định các mục cụ thể trong một hình ảnh chỉ bằng một vài cú nhấp chuột.Trong khi vẫn ở chế độ demo, công ty cho biết chia nhỏ mọi thứ Có thể chụp ảnh và xác định riêng từng pixel tạo nên mọi thứ trong ảnh để có thể tách một hoặc nhiều mục khỏi phần còn lại của ảnh.
Meta nóng bỏng với SAM
Segment Anything Model (SAM) là một hệ thống phân khúc nhanh chóng. Nó có thể “cắt” bất kỳ đối tượng nào trong bất kỳ hình ảnh nào chỉ bằng một cú nhấp chuột.
Mặt nạ có thể được theo dõi trong video, cho phép các ứng dụng chỉnh sửa hình ảnh và thậm chí được tăng cường thành 3D
🧵 tham quan và kiểm tra nhanh pic.twitter.com/YC0JSWYy9X
– Nick St.Pierre (@nickfloats) Ngày 5 tháng 4 năm 2023
Meta đã viết trong một bài đăng thông báo về mô hình mới: “Phân đoạn—xác định pixel hình ảnh nào thuộc về một đối tượng—là nhiệm vụ cốt lõi trong thị giác máy tính và được sử dụng trong nhiều ứng dụng, từ phân tích hình ảnh khoa học đến chỉnh sửa ảnh”.
Meta cho biết việc tạo các mô hình phân đoạn chính xác cho các tác vụ cụ thể đòi hỏi nỗ lực chuyên môn cao của các chuyên gia kỹ thuật có quyền truy cập vào cơ sở hạ tầng đào tạo AI và một lượng lớn dữ liệu trong miền được chú thích cẩn thận.
Ross Girshick, một nhà khoa học nghiên cứu tại Meta, cho biết: “Bằng cách thu thập các bộ dữ liệu mới chưa từng có, chúng tôi đã đạt được sự khái quát hóa cao hơn so với các phương pháp trước đây”. giải mã trong thư điện tử. “Điều quan trọng là trong bộ dữ liệu này, chúng tôi không giới hạn các loại đối tượng mà chúng tôi đã chú thích.
Girshick nói thêm: “Do kích thước của dữ liệu và tính phổ biến của nó, mô hình kết quả của chúng tôi cho thấy khả năng ấn tượng để xử lý các loại hình ảnh không thấy được trong quá trình đào tạo, chẳng hạn như hình ảnh vị kỷ, kính hiển vi hoặc ảnh chụp dưới nước.”
Trí tuệ nhân tạo sáng tạo là một hệ thống trí tuệ nhân tạo có thể tạo văn bản, hình ảnh hoặc phương tiện khác dựa trên lời nhắc. Một số ví dụ nổi bật nhất của công nghệ này là ChatGPT của OpenAI và nền tảng nghệ thuật kỹ thuật số Midjourney.
Meta cho biết hệ thống AI của Segment Anything đã được đào tạo trên hơn 11 triệu hình ảnh.Như Girshick đã giải thích, Meta đang cung cấp Segment Anything cho cộng đồng nghiên cứu theo giấy phép mở Apache 2.0, có sẵn thông qua chia nhỏ mọi thứ Github.
Lyle Solomon, cố vấn trưởng của Oak View Law Group, cho biết: “Một khía cạnh quan trọng của luật riêng tư là việc thu thập dữ liệu phải được thực hiện một cách minh bạch và với sự đồng ý hoàn toàn của cá nhân. giải mã“Việc sử dụng AI để nhận dạng khuôn mặt mà không có sự đồng ý rõ ràng đặt ra câu hỏi về khả năng vi phạm luật riêng tư. Ngoài ra, các công ty nên hạn chế chia sẻ dữ liệu khuôn mặt với bên thứ ba trừ khi các cá nhân đồng ý và mọi hoạt động chia sẻ phải tuân theo quyền riêng tư theo quy định của pháp luật.”
Girshick cho biết Segment Anything đang trong giai đoạn nghiên cứu và không có kế hoạch sử dụng nó trong sản xuất. Tuy nhiên, vẫn có những lo ngại liên quan đến quyền riêng tư trong số các ứng dụng tiềm năng của AI.
Vào tháng 2, Meta đã chuyển từ kế hoạch ra mắt metaverse để tập trung vào các sản phẩm khác, bao gồm cả trí tuệ nhân tạo, thông báo về việc tạo ra một nhóm sản phẩm mới tập trung vào AI tổng hợp. Sự thay đổi diễn ra sau khi công ty sa thải hơn 10.000 nhân viên sau khi kết thúc dự án Instagram NFT.
Các nhà lãnh đạo toàn cầu, đã chán ngấy với những tiến bộ của trí tuệ nhân tạo, đã bày tỏ lo ngại và điều tra công khai về công nghệ này cũng như ý nghĩa của nó đối với quyền riêng tư và bảo mật của người dùng sau khi ra mắt ChatGPT của OpenAI. Ý đã cấm các chatbot phổ biến.
“Nhiều người dùng không hiểu quy trình hoạt động như thế nào hoặc hậu quả lâu dài sẽ ra sao nếu khuôn mặt của họ được sử dụng để đào tạo các mô hình máy học mà không có sự đồng ý của họ,” Christine Rubychủ tịch công ty tư vấn mạng xã hội và trí tuệ nhân tạo Ruby Media Group nói giải mã.
“Thách thức lớn nhất mà nhiều công ty phải đối mặt là thu thập dữ liệu đào tạo trên quy mô lớn và không có nguồn dữ liệu đào tạo nào tốt hơn nguồn dữ liệu đào tạo do những người cung cấp trên mạng xã hội,” cô nói.
Ruby khuyên bạn nên kiểm tra xem liệu công ty có cung cấp dịch vụ máy học để thông báo cho người dùng cách dữ liệu của họ đang được sử dụng hay không và liệu họ có thể chọn không tham gia các mô hình đào tạo trong tương lai hay không. Cô ấy lưu ý rằng nhiều công ty hiện có mặc định chọn tham gia, nhưng có thể thay đổi thành không tham gia trong tương lai.
“Chúng tôi sử dụng nhiều kỹ thuật bảo vệ quyền riêng tư, chẳng hạn như làm mờ khuôn mặt và các thông tin nhận dạng cá nhân khác như biển số xe,” Girshick nói. “Người dùng có thể báo cáo nội dung xúc phạm cho chúng tôi bằng cách gửi email tới [email protected] kèm theo ID hình ảnh và chúng tôi sẽ xóa nội dung đó khỏi tập dữ liệu của mình.”