Cập nhật ngày 15/08/2020 - 00:22:35

           

Tương lai của nhận dạng và giả lập giọng nói

- Bạn biết Google phải không nào? Nhân vật này càng ngày càng hot mặc dù không phải là người thật. Đây là một trí tuệ nhân tạo điển hình của nhận dạng và giả lập giọng nói. Công nghệ nhận dạng giọng nói nhìn chung còn khá mới mẻ. Hiện nay chỉ mới có một số ông lớn công nghệ lấn sân vào cuộc chơi như Google hay Apple.

Công nghệ nhận dạng và giả lập giọng nói

AI (Artificial Intelligence) hay được biết tới nhiều hơn với là trí tuệ nhân tạo thực chất là một chương trình máy tích lớn, có khả năng xử lý hàng trăm dữ liệu khác nhau. Các chuyên gia nhận định, AI còn có rất nhiều tiềm năng bởi hiện tại mới chỉ có khai thác một số. Điển hành nhất của AI đó là công nghệ nhận dạng và giả lập giọng nói.

Công nghệ AI giả lập giọng nói làm chủ tương lai

Nhận dạng giọng nói và nhại lại đúng theo giọng nói đó chính là công nghệ này. Trong số các AI nhận dạng và giả lập giọng nói nổi tiếng nhất đó là Google Assistant của Google – cô trợ lý ảo của Google. “Cô ta” có thể đọc thành tiếng những từ ngữ mà bạn viết trên google, hiểu được giọng nói của bạn để thu nhận thông tin và tìm kiếm theo yêu cầu của bạn. Đơn giản, công nghệ nhận dạng và giả lập giọng nói là vậy!

Một số ứng dụng của nhận dạng và giả lập giọng nói trên thế giới

Hiện nay có tương đối nhiều nghiên cứu về việc triển khai, giới thiệu thành công các ứng dụng nhận dạng và giả lập giọng nói. Các ứng dụng này cho phép người dùng được hỏi, nhận câu trả lời để thực hiện những mục đích nhất định. Gần đây nhất là Amazon khi cập nhật app Kindle ở trên iOS có tính năng VoiceOver có thể tự động xem sách cho người khiếm thị, giúp họ xem sách trở nên dễ dàng hơn.

Một nhân vật quen thuộc khác đó là Siri, Cortana là những phần mềm đã giúp cho người sử dụng trên thiết bị di động tương tác động nhiều với các thiết bị thông minh bằng cách đặt câu hỏi, trả lời để nhằm thực hiện mục đích như điều chỉnh tự động các tab vụ, thiết lập giờ giấc.

Bên cạnh đó là những sản phẩm, dịch vụ như Over-The-Top trên zalo, viber, whatsapp có tính năng chat giọng nói giúp cho người sử dụng không cần phải dùng tay nhấn phím để chat dễ dàng. Ngoài ra, các phần mềm học tiếng anh nói riêng và ngoại ngữ nói chung hiện nay cũng ứng dụng thành công các công nghệ nhận dạng và giả lập giọng nói đem tới trải nghiệm thú vị cũng như nâng cao được hiệu quả công việc, học tập.

Các mô hình triển khai công nghệ nhận dạng và giả lập giọng nói


Mô hình triển khai nhận diện và giả lập giọng nói

Điện toán đám mây

Những ví dụ như Siri, Google Voice, Cortana hiện đang dùng điện toán đám mây để nhận dạng và giả lập giọng nói. Cách thức này hoạt động bằng cách nhận dạng, xử lý ngôn ngữ trên máy chủ của các công ty cung cấp dịch vụ (google, facebook, zalo,…) thông qua kết nối internet. Phương thức này hoạt động hiệu quả, chính xác cao nhưng nhìn chung là tương đối chậm và lúc nào người dùng cũng phải có internet.

Tích hợp thẳng vào app

Quá trình này được hoạt động trong chính ứng dụng, nội bộ app. Nhờ vậy mà tốc độ xử lý sẽ nhanh chóng hơn. Người sử dụng không cần phải dùng đến internet cũng có thể sử dụng công nghệ nhận dạng và giả lập giọng nói trong app. Tuy nhiên, người dùng cần phải luôn cập nhật về bộ máy nhận dạng về app.

Dù thế nào đi chăng nữa thì chúng ta có thể nhận thấy rằng công nghệ nhận dạng và giả lập giọng nói có xu hướng ngày càng phát triển. Đi kèm với những tiện ích mà công nghệ mang lại thì con người chúng ta cũng phải đối mặt với những rủi ro khó lường!

Phương Uyên
Tổng hợp
* Ý kiến bạn đọc
* Tin đáng chú ý
* Các tin liên quan