Jumlah aplikasi lan pentinge antarmuka swara berkembang kanthi cepet

Isi

papat gedhe
Amerika pengin tuku
Cuci, panggang, resik!
Konsep lawas. Wis wektu dheweke pungkasanipun teka?
pitakonan teknis angel
Swara? Seni grafis? Utawa mungkin loro?
Watch out kanggo safety!

Kulawarga Amerika ing Portland, Oregon bubar ngerti yen asisten swara Alex ngrekam obrolan pribadi lan dikirim menyang kanca. Pemilik omah, sing diarani Danielle dening media, ngandhani wartawan yen dheweke "ora bakal nyambungake piranti iki maneh amarga dheweke ora bisa dipercaya."

Alexa, sing disedhiyakake dening speaker Echo (1) lan gadget liyane ing puluhan yuta omah AS, wiwit ngrekam nalika krungu jeneng utawa "tembung panggilan" sing diucapake dening pangguna. Iki tegese sanajan tembung "Alexa" kasebut ing iklan TV, piranti kasebut bisa miwiti ngrekam. Sing persis kedadeyan ing kasus iki, ujare Amazon, distributor hardware.

"Obrolan liyane diinterpretasikake dening asisten swara minangka prentah kanggo ngirim pesen," ujare perusahaan kasebut ing pratelan. "Ing sawetara wektu, Alexa takon kanthi banter, "Kanggo sapa?" Terusake obrolan kulawarga babagan jubin kayu atos kudu dirasakake dening mesin minangka item ing dhaptar kontak pelanggan. Paling ora sing Amazon mikir. Mangkono, terjemahan dikurangi dadi sawetara kacilakan.

Kuatir, Nanging, tetep. Amarga sakperangan alesan ing omah sing isih kepenak, kita kudu ngetik sawetara "mode swara", nonton apa sing kita ucapake, apa sing ditayangake TV lan, mesthi, apa speaker anyar iki ing laci. ngandika . kita.

Nanging, Senadyan cacat teknologi lan masalah privasi, kanthi popularitas piranti kaya Amazon Echo, wong-wong mulai terbiasa karo ide sesambungan karo komputer nggunakake swara..

Minangka Werner Vogels, CTO saka Amazon, nuding metu sak AWS re: Invent sesi ing pungkasan 2017, teknologi wis dadi adoh mbatesi kemampuan kita kanggo sesambungan karo komputer. Kita ngetik tembung kunci menyang Google nggunakake keyboard, amarga iki isih cara sing paling umum lan paling gampang kanggo ngetik informasi menyang mesin.

Vogels ngandika. -

papat gedhe

Nalika nggunakake mesin telusur Google ing telpon, kita bisa uga weruh tandha mikropon kanthi telpon kanggo ngomong suwe banget. Iki Google saiki (2), sing bisa ndhikte pitakon telusuran, ngetik pesen kanthi swara, lsp. Ing taun-taun pungkasan, Google, Apple, lan Amazon saya apik banget. teknologi pangenalan swara. Asisten swara kaya Alexa, Siri, lan Asisten Google ora mung ngrekam swara sampeyan, nanging uga ngerti apa sing sampeyan ucapake lan mangsuli pitakon.

Google Saiki kasedhiya gratis kanggo kabeh pangguna Android. Aplikasi kasebut bisa, contone, nyetel weker, mriksa ramalan cuaca lan mriksa rute ing peta Google. Ekstensi obrolan saka Google Now nyatakake Asisten Google () – bantuan virtual kanggo pangguna saka peralatan. Kasedhiya utamane ing piranti seluler lan omah pinter. Ora kaya Google Saiki, bisa melu ijol-ijolan rong arah. Asisten debut ing Mei 2016 minangka bagéan saka aplikasi olahpesen Google Allo, uga ing speaker swara Google Home (3).

3. Ngarep Google

Sistem IOS uga duwe asisten virtual dhewe, Siri, yaiku program sing kalebu ing sistem operasi Apple iOS, watchOS, tvOS homepod, lan macOS. Siri debut karo iOS 5 lan iPhone 4s ing Oktober 2011 ing konferensi Let's Talk iPhone.

Piranti lunak adhedhasar antarmuka conversational: ngenali wicara alami pangguna (karo iOS 11 uga bisa ngetik printah kanthi manual), njawab pitakonan lan ngrampungake tugas. Thanks kanggo introduksi machine learning, asisten liwat wektu nganalisa preferensi pribadi pangguna kanggo nyedhiyakake asil lan rekomendasi sing luwih relevan. Siri mbutuhake sambungan Internet sing tetep - sumber informasi utama ing kene yaiku Bing lan Wolfram Alpha. iOS 10 ngenalake dhukungan kanggo ekstensi pihak katelu.

Siji liyane saka papat gedhe Cortana. Iku asisten pribadi cerdas digawe dening Microsoft. Didhukung ing Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android, lan platform iOS. Cortana pisanan dikenalaké ing Konferensi Pangembang Microsoft Build ing April 2014 ing San Francisco. Jeneng program kasebut asale saka jeneng karakter saka seri game Halo. Cortana kasedhiya ing basa Inggris, Italia, Spanyol, Prancis, Jerman, Cina, lan Jepang.

Pangguna program sing wis kasebut Alexa uga kudu nimbang watesan basa - asisten digital mung nganggo basa Inggris, Jerman, Prancis lan Jepang.

Asisten Virtual Amazon pisanan digunakake ing speaker pinter Amazon Echo lan Amazon Echo Dot sing dikembangake dening Amazon Lab126. Nyedhiyakake interaksi swara, puter maneh musik, nggawe dhaptar sing kudu ditindakake, setelan weker, streaming podcast, puter maneh buku audio, lan cuaca nyata, lalu lintas, olahraga, lan informasi warta liyane kayata warta (4). Alexa bisa ngontrol macem-macem piranti cerdas kanggo nggawe sistem otomatisasi omah. Sampeyan uga bisa digunakake kanggo nggawe blanja sing trep ing toko Amazon.

4. Kanggo Apa Pangguna Gunakake Echo (Miturut Riset)

Pangguna bisa nambah pengalaman Alexa kanthi nginstal Alexa "katrampilan" (), fitur tambahan sing dikembangake dening pihak katelu, luwih umum diarani minangka app kayata cuaca lan program audio ing setelan liyane. Umume piranti Alexa ngidini sampeyan ngaktifake asisten virtual kanthi sandhi tangi, sing diarani .

Amazon mesthi ndominasi pasar speaker pinter saiki (5). IBM, sing ngenalake layanan anyar ing Maret 2018, nyoba mlebu papat paling dhuwur Asisten Watson, dirancang kanggo perusahaan sing pengin nggawe sistem asisten virtual dhewe kanthi kontrol swara. Apa keuntungan saka solusi IBM? Miturut perwakilan perusahaan, pisanan, babagan kesempatan sing luwih gedhe kanggo personalisasi lan proteksi privasi.

Kaping pisanan, Asisten Watson ora duwe merek. Perusahaan bisa nggawe solusi dhewe ing platform iki lan menehi label nganggo merek dhewe.

Kapindho, padha bisa nglatih sistem assistive nggunakake set data dhewe, kang ngandika IBM nggampangake kanggo nambah fungsi lan printah kanggo sistem saka teknologi VUI (antarmuka panganggo swara).

Katelu, Asisten Watson ora menehi informasi marang IBM babagan aktivitas pangguna - pangembang solusi ing platform mung bisa nyimpen data sing penting kanggo awake dhewe. Sauntara kuwi, sapa wae sing nggawe piranti, umpamane karo Alexa, kudu ngerti yen data sing penting bakal ana ing Amazon.

Asisten Watson wis duwe sawetara implementasine. Sistem kasebut digunakake, contone, dening Harman, sing nggawe asisten swara kanggo mobil konsep Maserati (6). Ing Bandara Munich, asisten IBM nguwasani robot Pepper kanggo nulungi penumpang. Conto katelu yaiku Teknologi Chameleon, ing ngendi teknologi swara digunakake ing meter omah sing cerdas.

6. Watson Assistant ing mobil konsep Maserati

Perlu ditambahake manawa teknologi dhasar ing kene uga ora anyar. Watson Assistant kalebu kapabilitas enkripsi kanggo produk IBM sing wis ana, Watson Conversation, lan Watson Virtual Agent, uga API kanggo analisis basa lan obrolan.

Amazon ora mung pimpinan ing teknologi swara cerdas, nanging ngowahi dadi bisnis langsung. Nanging, sawetara perusahaan wis nyoba integrasi Echo luwih awal. Sisense, perusahaan ing industri BI lan analytics, ngenalake integrasi Echo ing Juli 2016. Sabanjure, wiwitan Roxy mutusake nggawe piranti lunak lan hardware dhewe kanthi kontrol swara kanggo industri perhotelan. Sadurungé taun iki, Synqq ngenalake aplikasi cathetan sing nggunakake pangolahan swara lan basa alami kanggo nambah cathetan lan entri tanggalan tanpa kudu ngetik ing keyboard.

Kabeh usaha cilik iki nduweni ambisi sing dhuwur. Nanging sing paling umum, dheweke ngerti manawa ora saben pangguna pengin nransfer data menyang Amazon, Google, Apple utawa Microsoft, sing dadi pemain paling penting kanggo mbangun platform komunikasi swara.

Amerika pengin tuku

Ing 2016, telusuran swara nyathet 20% kabeh telusuran seluler Google. Wong sing nggunakake teknologi iki saben dina nyebutake penak lan mbukak akeh tugas ing antarane keuntungan paling gedhe. (contone, kemampuan kanggo nggunakake mesin telusur nalika nyopir mobil).

Analis Visiongain ngira nilai pasar saiki asisten digital cerdas ing $ 1,138 milyar. Ana liyane lan liyane mekanisme kuwi. Miturut Gartner, ing pungkasan 2018 wis 30% saka interaksi kita karo teknologi bakal liwat obrolan karo sistem swara.

Perusahaan riset Inggris IHS Markit ngira manawa pasar kanggo asisten digital sing dikuwasani AI bakal tekan 4 milyar piranti ing pungkasan taun iki, lan jumlah kasebut bisa mundhak dadi 2020 milyar ing taun 7.

Miturut laporan saka eMarketer lan VoiceLabs, 2017 yuta wong Amerika nggunakake kontrol swara paling ora sapisan sasi ing 35,6. Iki tegese mundhak meh 130% saka taun sadurunge. Pasar asisten digital mung bakal tuwuh ing 2018% ing 23. Iki tegese sampeyan wis nggunakake. 60,5 yuta wong Amerika, sing bakal ngasilake dhuwit konkrit kanggo produsere. RBC Capital Markets ngira manawa antarmuka Alexa bakal ngasilake penghasilan nganti $2020 milyar kanggo Amazon ing taun 10.

Cuci, panggang, resik!

Antarmuka swara saya tambah wani mlebu ing peralatan omah lan pasar elektronik konsumen. Iki wis bisa dideleng nalika pameran IFA 2017 taun kepungkur. Perusahaan Amerika Neato Robotics ngenalake, contone, robot vacuum cleaner sing nyambung menyang salah siji saka sawetara platform omah cerdas, kalebu sistem Amazon Echo. Kanthi ngomong karo speaker pinter Echo, sampeyan bisa nglatih mesin kanggo ngresiki kabeh omah ing wektu tartamtu dina utawa wengi.

Produk sing diaktifake swara liyane ditampilake ing acara kasebut, wiwit saka TV cerdas sing didol ing merek Toshiba dening perusahaan Turki Vestel nganti selimut sing digawe panas dening perusahaan Jerman Beurer. Akeh piranti elektronik kasebut uga bisa diaktifake kanthi jarak jauh nggunakake smartphone.

Nanging, miturut perwakilan Bosch, isih awal banget kanggo ujar manawa pilihan asisten omah sing bakal dadi dominan. Ing IFA 2017, klompok teknis Jerman nampilake mesin cuci (7), oven lan mesin kopi sing nyambung menyang Echo. Bosch uga pengin piranti kasebut kompatibel karo platform swara Google lan Apple ing mangsa ngarep.

7. Mesin cuci Bosch sing nyambung menyang Amazon Echo

Perusahaan kayata Fujitsu, Sony lan Panasonic ngembangake solusi asisten swara basis AI dhewe. Sharp nambahake teknologi iki menyang oven lan robot cilik sing mlebu pasar. Nippon Telegraph & Telephone nyewa pembuat hardware lan dolanan kanggo adaptasi sistem intelijen buatan sing dikontrol swara.

Konsep lawas. Wis wektu dheweke pungkasanipun teka?

Nyatane, konsep Voice User Interface (VUI) wis ana pirang-pirang dekade. Sapa wae sing nonton Star Trek utawa 2001: A Space Odyssey pirang-pirang taun kepungkur bisa uga ngarepake yen sekitar taun 2000 kita kabeh bakal ngontrol komputer nganggo swara kita. Kajaba iku, ora mung panulis fiksi ilmiah sing ndeleng potensial antarmuka jinis iki. Ing taun 1986, peneliti Nielsen takon para profesional IT apa sing dikira bakal dadi owah-owahan paling gedhe ing antarmuka panganggo ing taun 2000. Dheweke paling asring nuduhake pangembangan antarmuka swara.

Ana alasan kanggo ngarep-arep solusi kasebut. Komunikasi lisan, sawise kabeh, cara sing paling alami kanggo wong kanthi sadar ngganti pikirane, mula nggunakake kanggo interaksi manungsa-mesin katon kaya solusi sing paling apik nganti saiki.

Salah siji saka VUI pisanan, disebut kothak sepatu, digawe ing awal 60s dening IBM. Iki minangka cikal bakal sistem pangenalan swara saiki. Nanging, pangembangan piranti VUI diwatesi dening watesan daya komputasi. Parsing lan interpretasi wicara manungsa ing wektu nyata mbutuhake akèh gaweyan, lan njupuk luwih saka sèket taun kanggo njaluk menyang titik ngendi iku bener dadi bisa.

Piranti kanthi antarmuka swara wiwit muncul ing produksi massal ing pertengahan 90-an, nanging ora entuk popularitas. Telpon pisanan kanthi kontrol swara (dial) yaiku Philips Spark Kabdirilis ing 1996. Nanging, piranti sing inovatif lan gampang digunakake iki ora luput saka watesan teknologi.

Telpon liyane sing dilengkapi karo wangun antarmuka swara (digawe dening perusahaan kayata RIM, Samsung utawa Motorola) ajeg kenek pasar, ngidini kedhaftar kanggo nelpon liwat swara utawa ngirim pesen teks. Kabeh mau, Nanging, kudu memorizing printah tartamtu lan pronouncing ing dipeksa, wangun Ponggawa, dicocogake kanggo Kapabilitas piranti ing wektu sing. Iki ngasilake akeh kesalahan, sing, banjur nyebabake rasa ora puas pangguna.

Nanging, saiki kita mlebu ing jaman komputasi anyar, ing ngendi kemajuan ing pembelajaran mesin lan intelijen buatan mbukak kunci potensial obrolan minangka cara anyar kanggo sesambungan karo teknologi (8). Jumlah piranti sing ndhukung interaksi swara wis dadi faktor penting sing wis impact amba ing pangembangan VUI. Saiki, meh 1/3 saka populasi donya wis duwe smartphone sing bisa digunakake kanggo jinis prilaku iki. Katon kaya umume pangguna pungkasane siyap ngganti antarmuka swara.

8. Sajarah modern pangembangan antarmuka swara

Nanging, sadurunge kita bisa ngomong karo komputer kanthi bebas, kaya sing ditindakake dening karakter A Space Odyssey, kita kudu ngatasi sawetara masalah. Mesin isih durung apik kanggo nangani nuansa linguistik. Kajaba iku akeh wong sing isih ora kepenak menehi printah swara menyang mesin telusur.

Statistik nuduhake yen asisten swara digunakake utamane ing omah utawa ing antarane kanca sing cedhak. Ora ana sing diwawancarai ngakoni nggunakake panelusuran swara ing panggonan umum. Nanging, blokade iki bisa uga ilang kanthi nyebarake teknologi iki.

pitakonan teknis angel

Masalah sing diadhepi sistem (ASR) yaiku ngekstrak data sing migunani saka sinyal wicara lan digandhengake karo tembung tartamtu sing nduweni makna tartamtu kanggo wong. Swara sing diprodhuksi beda-beda saben wektu.

Variabilitas sinyal wicara minangka sifat alamiah, amarga kita, contone, ngenali aksen utawa intonasi. Saben unsur sistem pangenalan wicara nduweni tugas tartamtu. Adhedhasar sinyal sing diproses lan paramèter, model akustik digawe, sing digandhengake karo model basa. Sistem pangenalan bisa digunakake kanthi basis pola cilik utawa akeh, sing nemtokake ukuran kosakata sing digunakake. Padha bisa kamus cilik ing kasus sistem sing ngenali tembung utawa printah individu, uga database gedhe ngemot pepadhan saking susunan basa lan nggatosaken model basa (tata basa).

Masalah sing diadhepi dening antarmuka swara ing wiwitan mangerteni pidhato kanthi bener, ing ngendi, contone, kabeh urutan gramatikal asring diilangi, kesalahan linguistik lan fonetis, kesalahan, ngilangi, cacat wicara, homonim, pengulangan sing ora adil, lan liya-liyane. Paling ora sing dikarepake.

Sumber kangelan uga sinyal akustik liyane saka wicara dikenali sing ngetik input saka sistem pangenalan, i.e. kabeh jinis gangguan lan gangguan. Ing kasus sing paling gampang, sampeyan butuh nyaring metu. Tugas iki katon rutin lan gampang - sawise kabeh, macem-macem sinyal disaring lan saben insinyur elektronik ngerti apa sing kudu ditindakake ing kahanan kaya ngono. Nanging, iki kudu ditindakake kanthi ati-ati lan kanthi ati-ati yen asil saka pengenalan ucapan bisa nyukupi pangarep-arep kita.

Nyaring sing saiki digunakake ndadekake iku bisa kanggo mbusak, bebarengan karo sinyal wicara, gangguan external dijupuk dening mikropon lan sifat internal sinyal wicara dhewe, kang nggawe angel kanggo ngenali. Nanging, masalah teknis sing luwih rumit muncul nalika interferensi sinyal wicara sing dianalisis yaiku ... sinyal wicara liyane, yaiku, umpamane, diskusi banter. Pitakonan iki dikenal ing sastra minangka sing disebut . Iki wis mbutuhake nggunakake cara Komplek, kang disebut. dekonvolusi (mbukak) sinyal.

Masalah karo pangenalan wicara ora mungkasi ana. Wigati dimangerteni manawa pidato ngemot macem-macem jinis informasi. Swara manungsa nuduhake jender, umur, karakter sing beda saka pemilik utawa kahanan kesehatane. Ana departemen teknik biomedis ekstensif sing ngurusi diagnosis macem-macem penyakit adhedhasar fenomena akustik karakteristik sing ditemokake ing sinyal wicara.

Ana uga aplikasi sing tujuan utama analisis akustik saka sinyal wicara yaiku kanggo ngenali penutur utawa verifikasi yen dheweke iku sing diklaim (swara tinimbang kunci, sandi utawa kode PUK). Iki bisa dadi penting, utamane kanggo teknologi bangunan sing cerdas.

Komponen pisanan saka sistem pangenalan wicara yaiku mikropon. Nanging, sinyal sing dijupuk dening mikropon biasane tetep ora ana gunane. Pasinaon nuduhake yen wangun lan mesthi gelombang swara beda-beda gumantung banget saka wong, kacepetan wicara, lan sebagéyan swasana ati saka interlocutor - nalika kanggo ombone cilik padha nggambarake isi banget saka printah ngandika.

Mulane, sinyal kasebut kudu diproses kanthi bener. Akustik modern, fonetik lan ilmu komputer bebarengan nyedhiyakake piranti sing sugih sing bisa digunakake kanggo ngolah, nganalisa, ngenali lan ngerti sinyal wicara. Spektrum dinamis saka sinyal, sing disebut spektrogram dinamis. Padha cukup gampang kanggo njupuk, lan wicara, presented ing wangun spektrogram dinamis, relatif gampang kanggo ngenali nggunakake Techniques padha digunakake ing pangenalan gambar.

Unsur prasaja saka wicara (contone, printah) bisa dikenali dening podho prasaja saka kabèh spectrograms. Contone, kamus telpon seluler sing diaktifake swara mung ngemot sawetara puluhan nganti sawetara atus tembung lan frasa, biasane wis ditumpuk supaya bisa dingerteni kanthi gampang lan efisien. Iki cukup kanggo tugas kontrol prasaja, nanging banget mbatesi aplikasi sakabèhé. Sistem sing dibangun miturut skema, minangka aturan, mung ndhukung pamicara khusus sing swara dilatih khusus. Dadi yen ana wong anyar sing pengin nggunakake swara kanggo ngontrol sistem kasebut, mesthine ora bakal ditampa.

Asil saka operasi iki diarani spektrogram 2-W, yaiku, spektrum rong dimensi. Ana kegiatan liyane ing blok iki sing kudu digatekake - segmentasi. Umumé, kita ngomong babagan pamisah sinyal wicara sing terus-terusan dadi bagean sing bisa dingerteni kanthi kapisah. Mung saka diagnosa individu kasebut supaya pangenalan kabeh digawe. Prosedur iki perlu amarga ora bisa ngenali wicara sing dawa lan rumit kanthi siji. Kabeh volume wis ditulis babagan segmen sing kudu dibedakake ing sinyal wicara, mula saiki kita ora bakal mutusake manawa segmen sing dibedakake yaiku fonem (padha swara), suku kata, utawa uga alofon.

Proses pangenalan otomatis tansah nuduhake sawetara fitur obyek. Atusan set paramèter beda wis diuji kanggo sinyal wicara dipérang dadi pigura dikenali lan gadhah fitur sing dipilihkanthi pigura kasebut ditampilake ing proses pangenalan, kita bisa nindakake (kanggo saben pigura kanthi kapisah) klasifikasi, i.e. nemtokake pengenal kanggo pigura, kang bakal makili ing mangsa.

Tahap sabanjure rakitan pigura dadi tembung kapisah - paling asring adhedhasar supaya disebut-. model saka model Markov implisit (HMM-). Banjur teka montase tembung ukara jangkep.

Saiki kita bisa bali menyang sistem Alexa kanggo wayahe. Tuladhane nuduhake proses multi-tataran mesin "pangerten" saka wong - luwih tepat: printah diwenehi dening wong utawa pitakonan.

Pangerten tembung, pangerten makna, lan pangerten maksud pangguna pancen beda.

Mulane, langkah sabanjure yaiku karya modul NLP (), tugas kasebut pangenalan maksud pangguna, i.e. tegesipun dhawuh/pitakon wonten ing konteks ingkang dipunandharaken. Yen maksud wis dikenali, banjur tugas sing disebut skills lan kabisan, yaiku fitur spesifik sing didhukung dening asisten pinter. Ing kasus pitakonan babagan cuaca, sumber data cuaca diarani, sing tetep diproses dadi wicara (TTS - mekanisme). Akibaté, pangguna krungu jawaban kanggo pitakonan sing ditakoni.

Swara? Seni grafis? Utawa mungkin loro?

Sistem interaksi modern sing paling dikenal adhedhasar perantara sing disebut antarmuka panganggo grafis (antarmuka grafis). Sayange, GUI dudu cara sing paling jelas kanggo sesambungan karo produk digital. Iki mbutuhake pangguna pisanan sinau carane nggunakake antarmuka lan ngelingi informasi iki karo saben interaksi sakteruse. Ing pirang-pirang kahanan, swara luwih trep, amarga sampeyan bisa sesambungan karo VUI mung kanthi ngomong karo piranti kasebut. Antarmuka sing ora meksa pangguna kanggo ngapalake lan ngapalake printah utawa cara interaksi tartamtu nyebabake masalah sing luwih sithik.

Mesthine, ekspansi VUI ora ateges nglirwakake antarmuka sing luwih tradisional - nanging, antarmuka hibrida bakal kasedhiya sing nggabungake sawetara cara sesambungan.

Antarmuka swara ora cocok kanggo kabeh tugas ing konteks seluler. Kanthi, kita bakal nelpon kanca nyopir mobil, lan malah ngirim SMS, nanging mriksa transfer paling anyar bisa dadi angel banget - amarga jumlah informasi sing dikirim menyang sistem () lan digawe dening sistem (sistem). Minangka Rachel Hinman nyaranake ing bukune Mobile Frontier, nggunakake VUI dadi paling efektif nalika nindakake tugas ing ngendi jumlah informasi input lan output cilik.

Smartphone sing disambungake menyang Internet trep nanging uga ora trep (9). Saben pangguna pengin tuku utawa nggunakake layanan anyar, dheweke kudu ndownload aplikasi liyane lan nggawe akun anyar. Lapangan kanggo panggunaan lan pangembangan antarmuka swara wis digawe ing kene. Tinimbang meksa pangguna nginstal macem-macem aplikasi utawa nggawe akun sing kapisah kanggo saben layanan, para ahli ujar manawa VUI bakal ngowahi beban tugas sing rumit kasebut menyang asisten swara sing dikuwasani AI. Iku bakal trep kanggo nindakake aktivitas abot. Kita mung bakal menehi pesenan.

9. Antarmuka swara liwat telpon pinter

Saiki, luwih saka mung telpon lan komputer sing disambungake menyang Internet. Termostat cerdas, lampu, ceret lan akeh piranti sing digabungake karo IoT uga disambungake menyang jaringan (10). Mangkono, ana piranti nirkabel ing saubengé sing ngisi urip kita, nanging ora kabeh mau pas karo antarmuka panganggo grafis. Nggunakake VUI bakal mbantu sampeyan nggabungake kanthi gampang menyang lingkungan kita.

10. Antarmuka swara karo Internet of Things

Nggawe antarmuka panganggo swara bakal dadi katrampilan desainer utama. Iki minangka masalah nyata - kabutuhan kanggo ngleksanakake sistem swara bakal nyengkuyung sampeyan supaya luwih fokus ing desain proaktif, yaiku, nyoba ngerteni tujuan awal pangguna, ngarepake kabutuhan lan pangarepan ing saben tahap obrolan.

Swara minangka cara sing efisien kanggo nglebokake data - ngidini pangguna kanthi cepet ngetokake perintah menyang sistem kanthi syarat dhewe. Ing sisih liya, layar menehi cara sing efisien kanggo nampilake informasi: ngidini sistem nampilake akeh informasi ing wektu sing padha, nyuda beban ing memori pangguna. Iku logis yen nggabungake menyang siji sistem muni nyemangati.

Penutur cerdas kaya Amazon Echo lan Google Home ora menehi tampilan visual. Ngartekno nambah akurasi pangenalan swara ing jarak moderat, padha ngidini operasi tangan-free, kang siji nambah keluwesan lan efficiency - padha seng di pengeni malah kanggo pangguna sing wis duwe smartphone karo kontrol swara. Nanging, kekurangan layar minangka watesan gedhe.

Mung bip sing bisa digunakake kanggo ngandhani pangguna babagan prentah sing bisa ditindakake, lan maca output kanthi banter dadi mboseni kajaba tugas sing paling dhasar. Nyetel timer kanthi printah swara nalika masak iku apik, nanging nggawe sampeyan takon pinten wektu isih ora perlu. Entuk ramalan cuaca biasa dadi tes memori kanggo pangguna, sing kudu ngrungokake lan nyerep serangkaian fakta sajrone seminggu, tinimbang njupuk saka layar kanthi cepet.

Desainer wis solusi hibrida, Echo Show (11), sing nambahake layar tampilan menyang speaker pinter Echo dhasar. Iki banget nggedhekake fungsi saka peralatan. Nanging, Echo Show isih kurang bisa nindakake fungsi dhasar sing wis suwe kasedhiya ing smartphone lan tablet. Ora bisa (durung) surfing web, nuduhake review, utawa nampilake isi grobag Amazon, contone.

Tampilan visual minangka cara sing luwih efektif kanggo nyedhiyakake informasi sing akeh tinimbang mung swara. Ngrancang kanthi prioritas swara bisa ningkatake interaksi swara, nanging ing wektu sing suwe, kanthi sewenang-wenang ora nggunakake menu visual kanggo interaksi bakal kaya gelut karo tangan siji sing diikat ing mburi. Amarga kerumitan swara lan tampilan antarmuka cerdas end-to-end, pangembang kudu nimbang pendekatan hibrida kanggo antarmuka.

Nambah efisiensi lan kacepetan sistem generasi wicara lan pangenalan wis bisa digunakake ing aplikasi lan wilayah kayata, contone:

• militèr (komando swara ing pesawat utawa helikopter, contone, F16 VISTA),

• transkripsi teks otomatis (wicara menyang teks),

• sistem informasi interaktif (Prime Speech, portal swara),

• piranti seluler (telpon, smartphone, tablet),

• robotika (Cleverbot - sistem ASR digabungake karo intelijen buatan),

• otomotif (kontrol hands-free komponen mobil, kayata Blue & Me),

• aplikasi ngarep (sistem ngarep pinter).

Watch out kanggo safety!

Otomotif, peralatan omah, pemanasan / pendinginan lan sistem keamanan omah, lan macem-macem peralatan omah wiwit nggunakake antarmuka swara, asring adhedhasar AI. Ing tahap iki, data sing dipikolehi saka mayuta-yuta obrolan karo mesin dikirim menyang komputasi awan. Cetha yen para pemasar kasengsem ing dheweke. Lan ora mung wong-wong mau.

Laporan anyar saka pakar keamanan Symantec nyaranake supaya pangguna printah swara ora ngontrol fitur keamanan kayata kunci lawang, apamaneh sistem keamanan omah. Semono uga kanggo nyimpen sandhi utawa informasi rahasia. Keamanan intelijen buatan lan produk cerdas durung diteliti kanthi cukup.

Nalika piranti ing saindhenging omah ngrungokake saben tembung, risiko hacking lan nyalahi panggunaan sistem dadi masalah sing penting banget. Yen panyerang entuk akses menyang jaringan lokal utawa alamat email sing gegandhengan, setelan piranti pinter bisa diowahi utawa direset menyang setelan pabrik, sing nyebabake kelangan informasi penting lan mbusak riwayat pangguna.

Ing tembung liyane, profesional keamanan wedi yen swara lan intelijen buatan sing didhukung VUI durung cukup pinter kanggo nglindhungi kita saka ancaman potensial lan nutup tutuk nalika wong liyo njaluk apa-apa.