Công nghệ nhận dạng giọng nói cho trẻ em

15/01/2018 09:34 GMT+7

Công ty khởi nghiệp Ireland - SoapBox Labs, đang có kế hoạch tạo ra một công nghệ cho phép nhận dạng ngôn ngữ một cách chính xác nhất cho trẻ em trên khắp thế giới.

Theo TechCrunch, SoapBox Labs dự kiến sẽ cung cấp công nghệ của mình cho các nhà phát triển phần cứng và phần mềm bên thứ ba. Ứng dụng có thể hỗ trợ đọc, phát triển ngôn ngữ và kiểm soát tiếng nói của trẻ cho các thiết bị IoT trong nhà, đồ chơi thông minh và trải nghiệm AR/VR.
Được thành lập vào năm 2013 bởi tiến sĩ Patricia Scanlon, một nhà nghiên cứu của Bell Labs với gần 20 năm kinh nghiệm trong lĩnh vực công nghệ nhận dạng giọng nói, startup có mục đích phát triển công nghệ nhận dạng giọng nói cho trẻ nhỏ. Trẻ có tiếng nói cao hơn và mẫu giọng khác nhau nhưng lại không có xu hướng thích nghi với máy móc như người trưởng thành.
Scanlon cho biết cô và nhóm SoapBox Labs bắt đầu nghiên cứu về vấn đề vào năm 2013 với nhiều kinh nghiệm trong việc phát triển công nghệ thoại. Sau một giai đoạn nghiên cứu sâu rộng, rõ ràng hành vi nói của trẻ rất khác người lớn.
Thay vì sử dụng cơ sở dữ liệu dành cho người lớn, SoapBox Labs đã tạo ra tập dữ liệu về trẻ (với hàng ngàn giờ dữ liệu về lời nói của trẻ) và kết hợp với sự hiểu biết của nhóm về giọng nói và hành vi của trẻ. Nền tảng sử dụng kỹ thuật trí tuệ nhân tạo (AI) để cung cấp các mô hình độc quyền và thuật toán ghi điểm trước khi cung cấp một công nghệ nhận dạng giọng nói tốt hơn cho trẻ.
Kết quả là SoapBox Labs đã phát hành phiên bản API nhận dạng giọng nói tiếng Anh cho trẻ đến các đối tác thứ ba. Công ty cho biết sẽ sớm cung cấp thông tin về các đối tác vào đầu tháng tới.
Công ty cũng tiết lộ nhận được khoản tài trợ trị giá 2,1 triệu EUR để bổ sung nhiều ngôn ngữ vào nền tảng nhận dạng giọng nói của mình, bao gồm 1,5 triệu EUR của EU và 600.000 EUR từ các nhà tài trợ hiện có. Tính đến thời điểm hiện tại, tổng kinh phí của SoapBox Labs có hơn 3 triệu EUR.
Thảo luận về tương lai của công nghệ nhận dạng giọng nói cho trẻ em, Scanlon cho biết cô kỳ vọng một tình huống mà thiết bị sẽ nhận ra nếu đó là từ một đứa trẻ hoặc người lớn, từ đó chuyển đổi bộ dữ liệu và mô hình cơ bản cho phù hợp. Điều này sẽ tối ưu các hoạt động bởi ngôn ngữ xử lý công nghệ của trẻ em là kém hơn so với người lớn.
Ngoài ra, một thiết bị hoặc ứng dụng biết rằng nó đang tương tác với một đứa trẻ có thể thay đổi các hành vi hoặc quyền tương tác.
Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.