Veo 2 của Google thách thức OpenAI, trong khi ChatGPT hiện chỉ cách WhatsApp một bước. Đừng bỏ lỡ 10 thông báo thay đổi cuộc chơi này:
1. Google đã ra mắt trình tạo video AI mới, Veo 2, tuyên bố rằng nó có xếp hạng khán giả tốt hơn Sora của OpenAI.
Veo 2 được thiết kế để tạo ra các video chân thực hơn, đưa Google vào cuộc cạnh tranh trực tiếp với OpenAI.
Google cũng đã nâng cấp mô hình tạo hình ảnh của mình, Imagen 3, để tạo ra những bức ảnh có nhiều chi tiết và phong phú hơn.
2. Google ra mắt Whisk, một công cụ AI cho phép bạn tạo hình ảnh mới bằng cách pha trộn và phối lại các hình ảnh hiện có.
Bạn chỉ cần nhập hình ảnh cho chủ thể, cảnh và phong cách—không cần lời nhắc văn bản.
3. OpenAI triển khai ChatGPT trên WhatsApp.
Người dùng tại Hoa Kỳ hiện có thể truy cập ChatGPT thông qua WhatsApp hoặc bằng cách gọi điện thoại.
Chỉ cần gọi 1-800-CHAT-GPT để tận hưởng 15 phút tương tác bằng giọng nói miễn phí mỗi tháng.
4. Gemini hiện cho phép bạn tải kho lưu trữ mã trực tiếp từ thiết bị vào Gemini Advanced để đơn giản hóa quy trình làm việc của bạn.
Bạn có thể gỡ lỗi, tái cấu trúc, viết lại và tối ưu hóa mã của mình với sự hiểu biết đầy đủ về toàn bộ dự án.
5. ChatGPT hiện hỗ trợ các ứng dụng mã hóa và ghi chú.
Ứng dụng trên máy tính để bàn tích hợp với các công cụ phổ biến như VS Code, Notion, v.v.
Người dùng cũng có thể sử dụng Chế độ giọng nói nâng cao để nói chuyện trực tiếp với ChatGPT.
6. Midjourney giới thiệu “bảng tâm trạng” theo phong cách Pinterest và hỗ trợ nhiều mô hình hình ảnh AI tùy chỉnh.
Người dùng hiện có thể tạo và chuyển đổi giữa các phiên bản tùy chỉnh khác nhau của trình tạo hình ảnh AI mới nhất của Midjourney, phiên bản 6.1, được thiết kế để phù hợp với sở thích thẩm mỹ độc đáo của họ.
7. Runway giới thiệu Mạng lưới tài năng, một nền tảng kết nối các thương hiệu và công ty với những người sáng tạo có kỹ năng về AI.
Mạng lưới này nhằm mục đích đáp ứng nhu cầu ngày càng tăng đối với các chuyên gia có thể tích hợp liền mạch các công cụ AI vào quy trình làm việc sáng tạo.
8. OpenAI công bố các mô hình biên giới mới: o3 và o3-mini.
Các mô hình này được thiết kế để mở rộng ranh giới của các khả năng AI đồng thời cung cấp các giải pháp có thể mở rộng cho nhiều ứng dụng khác nhau.
9. ElevenLabs giới thiệu Flash, một mô hình chuyển văn bản thành giọng nói AI tốc độ cao, tạo ra giọng nói chỉ trong 75ms.
Flash có hai phiên bản, v2 và v2.5, với giá 1 tín dụng cho mỗi 2 ký tự.10. Instagram đang giới thiệu các công cụ chỉnh sửa AI mới sẽ biến đổi hoàn toàn video của bạn.
Năm tới, Instagram sẽ tung ra tính năng AI tạo hình được hỗ trợ bởi mô hình Movie Gen AI của Meta.
Công cụ này sẽ cho phép người dùng thay đổi hầu hết mọi khía cạnh của video, cung cấp cho người sáng tạo các công cụ mạnh mẽ để biến ý tưởng của họ thành hiện thực mà không cần kỹ năng chỉnh sửa video nâng cao.
10. Công cụ chỉnh sửa AI của Instagram
Năm tới, Instagram sẽ tung ra tính năng AI tạo sinh được hỗ trợ bởi mô hình AI Movie Gen của Meta.
Công cụ này sẽ cho phép người dùng thay đổi hầu như mọi khía cạnh của video, cung cấp cho người sáng tạo các công cụ mạnh mẽ để hiện thực hóa ý tưởng của họ mà không cần kỹ năng chỉnh sửa video nâng cao.