Ngày 6/4, Google ra mắt ứng dụng đọc chính tả hoạt động ngoại tuyến có tên “Google AI Edge Eloquent” trên iOS để cạnh tranh với các ứng dụng như Wispr Flow, SuperWhisper, Willow và các ứng dụng khác.
Ứng dụng được tải xuống miễn phí, và sau khi các mô hình nhận diện giọng nói (ASR) dựa trên Gemma được cài đặt, bạn có thể bắt đầu đọc chính tả trực tiếp trên điện thoại. Trong ứng dụng, bạn sẽ thấy nội dung được phiên âm theo thời gian thực, và khi nhấn tạm dừng, ứng dụng sẽ tự động loại bỏ các từ đệm như “ừm”, “à” và chỉnh sửa lại văn bản cho mượt mà hơn.
Bên dưới phần nội dung phiên âm còn có các tùy chọn như “Key points” (ý chính), “Formal” (trang trọng), “Short” (ngắn gọn) và “Long” (dài hơn) để bạn biến đổi văn bản theo nhu cầu.

Bạn có thể tắt chế độ đám mây để chỉ sử dụng xử lý cục bộ. (Khi chế độ đám mây được bật, ứng dụng sử dụng các mô hình Gemini dựa trên đám mây để làm sạch văn bản.) Google AI Edge Eloquent có thể nhập một số từ khóa, tên và thuật ngữ chuyên ngành từ tài khoản Gmail của bạn nếu bạn cho phép. Ngoài ra, bạn cũng có thể thêm các từ tùy chỉnh của riêng mình vào danh sách.
Ứng dụng cũng hiển thị lịch sử các phiên ghi âm và cho phép bạn tìm kiếm trong toàn bộ nội dung đó. Nó có thể hiển thị cho bạn số từ đã đọc trong phiên gần nhất, tốc độ đọc (số từ mỗi phút) và tổng số từ đã nói.
“Google AI Edge Eloquent là một ứng dụng đọc chính tả tiên tiến được thiết kế để thu hẹp khoảng cách giữa lời nói tự nhiên và văn bản chuyên nghiệp. Không giống như phần mềm đọc chính tả thông thường ghi lại nguyên văn những lỗi vấp và từ đệm, Eloquent sử dụng trí tuệ nhân tạo để nắm bắt ý nghĩa bạn muốn truyền đạt. Nó tự động chỉnh sửa các từ như ‘ừm’, ‘à’ và các lỗi tự sửa giữa câu, cho ra văn bản mạch lạc và chính xác,” theo mô tả trên App Store của công ty.
Mặc dù ứng dụng hiện chỉ có sẵn trên iOS, nhưng phần mô tả trên App Store lại đề cập đến phiên bản Android.
Theo mô tả, Eloquent cung cấp khả năng “tích hợp Android liền mạch”, cho phép người dùng đặt làm bàn phím mặc định để sử dụng trên toàn hệ thống ở mọi ô nhập văn bản. Ngoài ra, ứng dụng còn có thể sử dụng nút nổi, tương tự như Wispr Flow trên Android, giúp truy cập nhanh tính năng chuyển giọng nói thành văn bản từ bất kỳ đâu.
Các ứng dụng chuyển giọng nói thành văn bản sử dụng trí tuệ nhân tạo đang ngày càng phổ biến khi các mô hình nhận diện giọng nói được cải thiện. Với ứng dụng thử nghiệm này, Google cũng đang tham gia vào xu hướng đó. Nếu thử nghiệm thành công, chúng ta có thể thấy các tính năng chuyển đổi giọng nói thành văn bản được nâng cấp trên hệ điều hành Android trong tương lai.
Theo TechCrunch














