A mesterséges beszédfordítás rövid története

Tartalomjegyzék

  • Mi a mesterséges intelligencia?
  • Mi az a beszédfordítás?
  • Az AI beszédfordítás története
  • A mesterséges beszédfordítás múltja, jelene és jövője
  • Kulcs elvitelek
  • Következtetés
  • GYIK

Beszédfordítás nem teljesen új jelenség. Már jó ideje létezik a digitális innováció világában. A technológia szerelmesei a tökéletesítésről álmodoztak automatikus beszéd fordítás már régóta. Az első beszédfordító rendszerrel, amely 1991-re nyúlik vissza, a mesterséges intelligencia által futtatott beszédfordító rendszereket ma már egyre gyakrabban használják a legtöbb okoseszközünkben.

A Google Pixel fülhallgatója rendelkezik a Google Fordító funkcióval, amely zökkenőmentes és hatékony hangfordítást biztosít az okostelefonos alkalmazáson keresztül. A Skype beszédfordításra alkalmas rendszerrel is rendelkezik. Az emberek most szeretnének beszélgetni a technológiáról és az azt létrehozó rendszerekről valós idejű beszédfordítások egy lehetőség.

Mi a mesterséges intelligencia?

Forrás

A mesterséges intelligencia (AI) a számítástechnika széles ága, amely emberi feladatok elvégzésére alkalmas gépek és rendszerek felépítésében vesz részt, vagy olyan feladatokat, amelyekhez tipikus emberi intelligencia szükséges. Siri, Alexa, intelligens asszisztensek az eszközökön, e-mail spamszűrők, mesterséges intelligencia webtartalom írása, a Netflix megtekintési ajánlásai, robo-tanácsadók, mind példák a mesterséges intelligencia használatára. Az AI egy érdekes próbálkozás az emberi intelligencia gépekben való szimulálására. A mesterséges intelligencia céljai és eredményei számos vita és vita tárgyát képezték.

Mi az a beszédfordítás?

A beszédfordítás az a folyamat, amelynek során a kimondott kifejezéseket gyorsan és hatékonyan lefordítják, valamint hangosan kimondják egy másik nyelven (a kívánt nyelven). A beszédfordítási technológia megkönnyíti a zökkenőmentes kommunikációt a különböző nyelvek beszélői között. A beszédfordító rendszerek három fő szoftverrendszer munkáját foglalják magukban: az automatikus beszédfelismerést, a hangszintézist és a gépi fordítást (MT).

Olvasni:  Az erős márkaidentitás kialakításának módjai

Forrás

Amikor mikrofonba beszél, a beszédfelismerő modul felismeri az Ön által elmondottakat. A gépi fordító modul és a beszédszintézis rendszer segítségével kimenetet ad le.

Az AI beszédfordítás története

Az automatikus beszédfordítás a digitális birodalom csábító rése. A technológia beszédfordítási folyamatba való beépítésének eredete 1947-re nyúlik vissza. Warren Weaver, a Rockefeller Alapítvány Természettudományi Osztályának akkori igazgatója megfigyelte a háborús időkben használt gépi dekódolás eredményeit.

Úgy gondolta, hogy van némi hiányosság a kriptográfiában, ami a fordítás során a pontosság problémáihoz vezetett. Míg az első gépi fordítórendszerek, amelyeket a világ valaha látott, kormány által finanszírozott kezdeményezések voltak, és az első világháború idején használták őket, akkoriban a világon sehol nem létezett tényleges számítástechnikai piac.

Akkoriban a gépek akkorák voltak, mint egy egész autó, és a legjobb fordítás, amit tudtak, szabályalapú volt. A dekódoló gépek működésének ez a hiányossága vezetett annak az ötletnek a megszületéséhez, hogy a gépeknek képesnek kell lenniük autonóm fordításra, a nyelvtani és nyelvi szabályokat alkalmazva.

1954-ben létrehozták az IBM 701-et. Körülbelül 49 kémiával kapcsolatos mondatot tudott lefordítani oroszról angolra. Ez nagy eredmény és az első sikeres lépés volt a nem numerikus számítógépes alkalmazások létrehozása terén. Ez sok kezdeti izgalomhoz vezetett, mígnem olyan kiskapukat fedeztek fel a használat során, mint a nem megfelelő szintaxis és nyelvtani hibák.

Aztán 1976-ban elindult a kanadai METEO rendszer (prototípusa). Lefordíthatja a meteorológiai előrejelzéseket franciára és angolra. Elsősorban az Environment Canada használta az előrejelzések fordítására az említett nyelveken.

1992-ben indult el először a gépi fordítási szolgáltatás, amely angolról németre fordítást kínált előfizetőinek. 1997-ben megszületett az AtlaVista „Babel Fish”. A nevet Douglas Adams népszerű regénysorozata ihlette. A Babel Fish képes volt német, angol, holland, francia, olasz és spanyol fordításra. És bár ez nagy ugrás volt a korai beszédfordítás világában, a Babel Fish nem volt megbízható, amikor egy adott nyelven több jelentéssel bíró szavak megfelelő fordításáról volt szó. Az általa biztosított fordításokat szemantikailag is megkérdőjelezték.

Olvasni:  Útmutató a képzési adatkészletek generatív mesterséges intelligenciával történő kiegészítéséhez

Kwabena Boahen villamosmérnök Alan Turing (brit tudós, aki ebben az évben megpróbált egy számítógépet emberi gondolkodást utánozni) munkája által inspirálva továbbfejlesztette a neurorács koncepcióját. Ez is rávilágított arra, hogy a számítógépek emberi nyelvének tanítása olyan feladat volt, amelyet csak akkor lehet megvalósítani, ha a számítógépek sikeresen beszélik a nyers, adatokkal táplált numerikus nyelvet.

A mesterséges beszédfordítás múltja, jelene és jövője

Míg korábban számos próbálkozás történt a számítógépek emberi nyelvének megtanítására, a modern beszédfordító rendszerek, mint például a Google Fordító, gyakorlatiasabbak, elegendő adatot táplálnak a számítógépbe párhuzamos szövegek formájában a fordításhoz szükséges nyelvekhez.

Ez a fajta rendszer inkább öntanuló. A számítógépes beszédfordítások biztosan sokat fejlődtek, de nem igazán pontosak. Gyorsan tesztelheti őket, ha felkeres egy webhelyet, és onnan kimásolja bármelyik történet URL-jét. Ezután illessze be az URL-t a Google Fordítóba. A kimenet alig fogja kiemelni a történet kontextusát.

Forrás

A jelenlegi MT-rendszerek nagyrészt elemzésre támaszkodnak, de a természetes nyelvek szerte a világon nem igazán analitikus formájúak. Kontextus, intonáció, hivatkozás az időre és a helyre: mindezek a tényezők a beszédfordítás következetlenségéhez vezetnek. Kulturális elmélyülés nélkül egy lefordított szó, mondat vagy szövegrész pontos jelentése nem érthető meg teljes erejében.

Még a latin ábécére épülő nyelvek között is folyamatosan zsugorodik és bővül a szöveg. Azoknál a nyelveknél, amelyek nem ragaszkodnak a latin ábécéhez, vagy a másik oldalról olvasnak (mint a japán tategaki és az arab, amelyeket jobbról balra olvasnak), a beszédfordítások egyre kevésbé pontosak. De ezzel semmiképpen sem ért véget az innováció és a technológiai fejlődés az AI beszédfordítás területén. Valójában ez csak a kezdet.

Olvasni:  Tartalommarketing oktatáshoz: legfontosabb előnyök és bevált gyakorlatok

A Google jelenleg a beszédfordítás zökkenőmentes integrálásával foglalkozik Android telefonokba. A Microsoft 2014-ben bemutatta a Skype valós idejű beszédfordítási funkciójának figyelemre méltó bemutatóját, amely akár 45 nyelvre képes lefordítani az élő videohívásokat. A Google mostantól azt is lehetővé teszi felhasználóinak, hogy javaslatokat tegyenek a jobb és jobb fordításokhoz. Az olyan alkalmazások, mint a Duolingo, nagy erőfeszítést tesznek annak érdekében, hogy az emberek világszerte jobban megértsenek más nyelveket, és a beszédfordítás erejét használják a helyes kiejtés meghatározására.

Kulcs elvitelek

  • A mesterséges intelligencia a számítástechnikának egy széles ága, amely olyan gépek és rendszerek felépítésében vesz részt, amelyek képesek emberi feladatokat ellátni, vagy olyan feladatokat, amelyekhez tipikus emberi intelligencia szükséges.
  • A technológia beszédfordítási folyamatba való beépítésének eredete 1947-re nyúlik vissza.
  • Míg korábban számos kísérletet tettek arra, hogy a számítógépeket emberi nyelvet tanítsák, a modern beszédfordító rendszerek, mint például a Google Fordító, gyakorlatiasabbak.
  • A kontextus, az intonáció, valamint az időre és a helyre való hivatkozás mind olyan tényező, amely a beszédfordítás következetlenségéhez vezet.
  • Azoknál a nyelveknél, amelyek nem ragaszkodnak a latin ábécéhez, vagy amelyeket a másik oldalról olvasnak, a beszédfordítások egyre kevésbé pontosak.
  • Az olyan alkalmazások, mint a Duolingo, nagy erőfeszítést tesznek annak érdekében, hogy segítsenek az embereknek szerte a világon, jobban megértsenek más nyelveket, és felhasználják a beszédfordítás erejét a helyes kiejtés meghatározására.

Következtetés

A mesterséges beszédfordítás az elkövetkező években minden bizonnyal tovább fejlődik. Abban még nem lehet megegyezni, hogy ez tökéletesíti-e a pontos és hibátlan átmenetek feladatát. Egy dolog azonban biztos: a beszédfordítás terén elért előrelépések segíteni fognak az embereknek leküzdeni azokat a nyelvi akadályokat, amelyekkel szembe kell nézniük, amikor új helyre költöznek munka, oktatás stb.

Olvasni:  10 tipp a divatmárka marketingjéhez 2024-ben

GYIK

1. Mi a beszédből szövegbe fordítás?

A beszédfelismerési folyamatot, amely felismeri a beszélt nyelvet és azt szöveggé fordítja, beszédből szövegbe fordításnak nevezik. Ez számítógépes nyelvészet segítségével történik.

2. Mi a mesterséges intelligencia három formája?

A mesterséges intelligencia nagyjából három típusba sorolható: szűk vagy gyenge AI, általános vagy erős AI és mesterséges szuperintelligencia.

3. Mire használják a mesterséges intelligenciát?

A mesterséges intelligencia nagyon hasznos a mai világban. Használható termelési szolgáltatások optimalizálására, tartalomírásra, személyre szabott ajánlások nyújtására az embereknek online fogyasztási szokásaik elemzésével, készlettervezéssel és logisztikai kezeléssel stb. Mára az AI annyira fejlett, hogy számos emberi feladatot képes ellátni.

4. Hogyan segítették a mesterséges intelligencia fejlesztései a fordítás növekedését?

A közelmúltban előrelépések történtek a gépi tanulás és a gépi fordítás területén. Ezeket kombinálták beszédfelismeréssel és okostelefon-alkalmazások fejlesztésével, amelyek segítségével az emberek útközben lefordíthatják a szavakat és mondatokat. Hatalmas fejlődés ment végbe a fordítás világában. A nyelvi hiányosságok ma már egyszerűen és hatékonyan áthidalhatók egy egyszerű mobiltelefon használatával.

5. Mi az AI fordító?

Az AI-fordítók olyan digitális technológia, amely erőteljes mesterséges intelligenciát használ a gépelt és kimondott betűk lefordításához. Néha még azt a kontextust is lefordítja, amelyen belül a tartalom létrejön. Pontosabb, mint az alapvető gépi fordítás.

Új publikációk:

Ajánlott