Prezentacje na żywo: Google słucha i sam dodaje podpisy
Coraz skuteczniejsze mechanizmy rozpoznawania mowy i jej transkrypcji na tekst pisany w wielu przypadkach pomogłyby nam w codziennej pracy. Google właśnie rozwija swoje Prezentacje, dodając do nich bardzo przydatną opcję - rejestrowanie głosu lektora przez mikrofon oraz natychmiastowe uzupełnianie pokazu slajdów podpisami, będącymi transkrypcją "usłyszanego" przemówienia. Niestety, nie jest to jeszcze opcja dostępna dla wszystkich - na razie będą z niej mogli korzystać angielskojęzyczni użytkownicy amerykańskich wersji Prezentacji, na dodatek wyposażeni w przeglądarkę rozwijaną przez Google - Chrome'a. Taki zestaw oprogramowania może przydać się podczas prelekcji.
Prezentacje Google z podpisami tłumaczonymi w czasie rzeczywistym? Tak, ale tylko w języku angielskim. Na polskojęzyczne napisy do slajdów będziemy musieli jeszcze trochę poczekać.
Prezentacje Google Docs z symultaniczną transkrypcją wystąpienia mogą stać się wkrótce stały elementem naszego życia. Nie tylko umożliwią osobom niedosłyszącym lub głuchym zrozumienie całego wykładu, mogą także stanowić formę cyfrowego zapisu wykładu, natychmiast przełożonego na formę pisaną, albo przydać się w zrozumieniu wypowiedzi tam, gdzie szum otoczenia przeszkadza w słuchaniu. Więcej, w zestawieniu z Tłumaczem Google, być może wkrótce język jakim włada odbiorca przestanie mieć znaczenie - symultaniczna, automatyczna translacja przyczyni się do łatwiejszej komunikacji. Jednak nie ma róży bez kolców: błędy związane przede wszystkim z kontekstem wypowiedzi mogą całkowicie zniekształcić przekaz. Również zawodowi symultaniczni tłumacze oberwą po kieszeni, kiedy zastąpią ich maszyny i oprogramowanie. Podobny mechanizm od ponad roku oferuje Microsoft Office w PowerPoincie, jednak i w tym przypadku wsparcie dla języka polskiego nie jest kompletne.
Google mówi armii: NIE - To koliduje z wartościami naszej AI
Na razie symultaniczna transkrypcja i przekład tekstu na inne języki to mrzonki przyszłości. Niezbyt odległej, ale wciąż przyszłości. Do przekładania mowy na tekst Google wykorzystuje cechy głosu prezentera, obejmujące akcent, intonację i modulację głosu. W kolejnych odsłonach modułu odpowiedzialnego za tworzenie napisów podczas prezentacji mają pojawić się inne języki. Na język polski prawdopodobnie przyjdzie nam jeszcze długo poczekać. W obecnej wersji Prezentacji mechanizm transkrypcji mowy na tekst działa wyłącznie podczas wyświetlania pokazu slajdów, po wybraniu ikony CC lub naciśnięciu kombinacji klawiszy Ctrl + Shift + C. W napisach uwzględnia interpunkcję, niestety nie ma opcji zapisywania tekstu do pliku. A szkoda, bo dostępny w pracach biurowych mechanizm transkrypcji mowy na tekst mógłby okazać się wygodnym uzupełnieniem całego pakietu narzędzi Google Docs.
Google+ zostanie zamknięty w przyszłym roku
Powiązane publikacje

ARM ma już 40 lat. Architektura, która zasila smartfony, serwery i roboty, trafiła do ponad 250 miliardów urządzeń
22
Anthropic chce zajrzeć do wnętrza AI. Czy do 2027 roku odkryjemy, jak naprawdę myślą modele językowe?
22
Firma Elona Muska xAI chce pozyskać 25 miliardów dolarów na budowę superkomputera Colossus 2 z milionem GPU NVIDIA
60
Nowatorski interfejs mózg-komputer od Georgia Tech może zmienić sposób, w jaki ludzie komunikują się z technologią i otoczeniem
4