Một trợ lý ảo là một tác tử phần mềm có khả năng thực hiện các tác vụ hoặc dịch vụ cho cá nhân người sử dụng. Đôi lúc người ta còn sử dụng thuật ngữ "chatbot" để chỉ các trợ lý ảo được truy cập bằng các phần mềm chat online (hoặc để chỉ các chương trình chat online mang tính giải trí và không đem lại nhiều công dụng).
Tính tới 2017, các tính năng và lượng người sử dụng của các trợ lý ảo đang tăng lên nhanh chóng, với các sản phẩm mới luôn được cho ra thị trường. Một khảo sát trực tuyến vào tháng 5 năm 2017 cho thấy những trợ lý ảo được dùng rộng rãi nhất tại Hoa Kỳ là Apple Siri (34%), Google Assistant (19%), Amazon Alexa (6%), và Microsoft Cortana (4%).[1] Trợ lý ảo M của Facebook được dự kiến phát hành tới hàng trăm triệu người dùng trên Facebook Messenger vào năm 2017.[2] Apple và Google có các trợ lý ảo được cài đặt nhiều nhất trên các điện thoại thông minh và Microsoft là trên các máy tính cá nhân chạy hệ điều hành Windows của hãng (trợ lý ảo Cortana của hãng được tích hợp vào hệ điều hành này cùng với các điện thoại và loa thông minh); trong khi đó, Alexa là sản phẩm đầu tiên có khả năng đặt hàng trực tuyến từ Amazon.[2]
Công cụ đầu tiên có khả năng nhận diện giọng nói kỹ thuật số là IBM Shoebox, được trình diễn trước công chúng trong Hội chợ Thế giới Seattle 1962 sau khi được bán ra năm 1961. Chiếc máy tính thuở đầu này, được phát triển gần 20 năm trước khi chiếc Máy tính cá nhân IBM đầu tiên được giới thiệu năm 1981, có khả năng nhận dạng 16 từ ngữ được nói và các số từ 0 đến 9. Cột mốc tiếp theo trong quá trình phát triển công nghệ nhận diện giọng nói là vào những năm 1970 tại Đại học Carnegie Mellon ở Pittsburgh, Pennsylvania với sự hỗ trợ vững chắc từ Bộ Quốc phòng Hoa Kỳ và cơ quan DARPA của Bộ này. Công cụ "Harpy" của họ có thể nhận dạng khoảng 1000 từ, tương đương vốn từ vựng của một đứa bé 3 tuổi. Khoảng 10 năm sau chính nhóm các nhà khoa học này đã tiếp tục phát triển một hệ thống không chỉ có thể phân tích các từ riêng biệt mà là cả một dãy từ, tức là cả câu, nhờ có Mô hình Markov ẩn.[3] Vì vậy, các trợ lý ảo sớm nhất áp dụng nhận dạng giọng nói là các tổng đài trả lời tự động và phần mềm đọc kỹ thuật số dùng trong y tế.[4] Vào những năm 1990, công nghệ nhận diện giọng nói số trở thành một tính năng của máy tính cá nhân, khiến các nhà sản xuất như Microsoft, IBM, Philips và Lernout & Hauspie thi nhau áp dụng để tranh giành khách hàng. Sự kiện ra mắt chiếc điện thoại thông minh đầu tiên IBM Simon vào năm 1994 đặt nền móng cho các trợ lý ảo thông minh mà ta biết tới ngày nay.[5] Trợ lý ảo số hiện đại đầu tiên được cài đặt trên một điện thoại thông minh là Siri, từng được giới thiệu là một tính năng trên chiếc iPhone 4S vào ngày 4 tháng 10 năm 2011.[6] Apple Inc. phát triển Siri sau khi mua lại Siri Inc., một công ty con của SRI International vào năm 2010, nơi từng là một viện nghiên cứu được tài trợ bởi DARPA và Bộ Quốc phòng Hoa Kỳ.[3]
Các trợ lý ảo nhận lệnh và làm việc thông qua:
Một số trợ lý ảo có thể truy cập được thông qua nhiều phương thức khác nhau, ví dụ như Google Assistant thông qua trò chuyện trên ứng dụng Google Allo và thông qua giọng nói trên loa thông minh Google Home.
Các trợ lý ảo sử dụng công nghệ xử lý ngôn ngữ tự nhiên (NLP) để chuyển văn bản hoặc giọng nói của người dùng thành các câu lệnh thực thi có sẵn. Nhiều trợ lý ảo còn có khả năng tiếp tục học thêm nhiều câu lệnh khác bằng công nghệ trí tuệ nhân tạo, trong đó có phương pháp học máy.
Để kích hoạt trợ lý ảo bằng giọng nói, đôi khi ta phải sử dụng các từ khóa. Đây có thể là một từ hoặc cụm từ, ví dụ như "Alexa" or "OK Google".[7]
Các trợ lý ảo có thể được tích hợp vào nhiều loại nền tảng khác nhau hoặc, giống như Amazon Alexa, trên khắp các nền tảng này:
Các trợ lý ảo có thể cung cấp rất nhiều dịch vụ, trong đó các dịch vụ trên Amazon Alexa và Google Assistant đang tăng lên từng ngày. Các dịch vụ này bao gồm:[16]
Amazon và Google cho ra mắt hai nền tảng là Alexa "Skills" và Google "Actions", chủ yếu là các ứng dụng chạy trên các nền tảng trợ lý ảo của các hãng.
Các nền tảng của các trợ lý ảo được sử dụng rộng rãi nhất cũng được sử dụng cho các giải pháp khác:
Trợ lý cá nhân thông minh | Nhà phát triển | Phần mềm tự do | Phần cứng tự do và mã nguồn mở | Xuất ra HDMI | I/O ngoài | IOT | Tích hợp Chromecast | Ứng dụng điện thoại thông minh | Luôn mở | Unit to unit voice channel |
---|---|---|---|---|---|---|---|---|---|---|
Assistant | Speaktoit | Không | — | — | — | Không | Không | Có | Không | — |
Alexa (hay còn gọi là Echo) | Amazon.com | Không | Không | Không | Không | Có | Không | Có | Có | ? |
Bixby | Samsung Electronics | Không | — | — | — | Không | Không | Có | — | — |
BlackBerry Assistant | BlackBerry Limited | Không | — | — | — | Không | Không | Có | Không | — |
Braina | Brainasoft | Không | — | — | — | Không | Không | Có | Không | — |
Cadence | Cadence studio | Không | — | — | — | — | Không | Có | Có | — |
Cortana | Microsoft | Không | — | — | — | Có | Không | Có | Có | — |
Evi | Amazon.com True Knowledge | Không | — | — | — | Không | Không | Có | Không | — |
Google Assistant | Có | — | — | — | Có | Không | Có | Có | — | |
Google Now | Không | — | — | — | Có | Có | Có | Có | — | |
M | ||||||||||
Mycroft[22] | Mycroft AI | Có | Có | Có | Có | Có | Có | Có | Có | Có |
Sherpa | Sherpa Europe SL | Không | — | — | — | Có | Không | Có | Có | — |
SILVIA | Cognitive Code | Không | — | — | — | Không | Không | Có | Không | — |
Siri | Apple Inc. | Không | — | — | — | Có | Không | Có | Có | — |
Lucida |
? | Có | — | — | — | Không | Không | Có | Không | — |
Viv | Samsung Electronics | Không | — | — | — | Có | Không | Có | Không | — |
Nina | Nuance | Không |
|tiêu đề=
tại ký tự số 53 (trợ giúp)