Seeing AI - aplikacja dla niewidomych od Microsoftu trafia na Androida. Sztuczna inteligencja pozwoli im zobaczyć świat

Natan Faleńczyk | 08-03-2024 18:30 |

Oprogramowanie

Seeing AI - aplikacja dla niewidomych od Microsoftu trafia na Androida. Sztuczna inteligencja pozwoli im zobaczyć świat Osoby niedowidzące oraz niewidome mają dość utrudnione życie w dzisiejszym świecie. Oczywiście do tej pory mogli liczyć na pewne ułatwienia, jednak aktualna technologia daje im dużo większe możliwości. Na systemie Android pojawiła się właśnie nowa aplikacja od Microsoftu, która nazywa się Seeing AI. Pozwala ona na identyfikowanie obiektów, scen i ludzi, którzy znajdują się przed kamerą smartfona, a następnie głosowe opisanie wybranych elementów przez asystenta AI.

Seeing AI jest dowodem na to, że obecną technologię związaną ze "sztuczną inteligencją" można wykorzystać w praktyczny i przydatny sposób. Aplikację docenią przede wszystkim osoby, które mają problemy ze wzrokiem, ponieważ umożliwi im ona „ujrzenie” wszystkiego, co ich otacza.

ChatGPT Plus - OpenAI wzbogaca multimodalny model. Nowa aktualizacja pozwala chatbotowi na pracę z plikami

Aplikacja Seeing AI znana jest użytkownikom smartfonów od Apple już od pewnego czasu, natomiast dopiero teraz zawitała na urządzenia z Androidem. Do działania wykorzystuje ona platformę Azure AI. Aktualnie multimodalne duże modele językowe (MLLM) radzą sobie bardzo dobrze nie tylko z tekstem, ale także z obrazami, muzyką, czy też materiałami wideo. Technologia ta pozwoliła na to, żeby omawiana aplikacja przedstawiała świat osobom niewidomym lub z wadami wzroku. Wystarczy, że skierujemy kamerę w smartfonie na konkretny obiekt, scenę lub dokument i za chwilę usłyszymy głosowy opis. W praktyce rozwiązanie wypada naprawdę zaskakująco dobrze.

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Seeing AI jest dostępna za darmo, więc wystarczy udać się do Sklepu Google Play lub App Store i pobrać oprogramowanie. Interfejs jest bardzo prosty i pozwala na wygodne przełączanie się pomiędzy trybami. W czasie rzeczywistym możemy odsłuchać tekst, który znajduje się przed nami, posłuchamy treści całych dokumentów, czy też zeskanujemy kody kreskowe danych produktów, a następnie usłyszymy, z jaką rzeczą mamy do czynienia. Funkcje pozwalają także na określenie wartości pieniędzy (nie ma jeszcze polskiej waluty), zidentyfikowanie liczby osób, całej sceny, czy też kolorów obiektów. Zaimplementowano nawet opcję, która dźwiękowo przedstawi, jak jasno jest w danym pomieszczeniu. Przetestowałem aplikację osobiście i mogę przyznać, że wszystko działa naprawdę błyskawicznie. Wystarczy, że przed kamerą ukaże się jakiś tekst i od razu usłyszymy jego treść. Obiekty i sceny są identyfikowane z dużą dokładnością, choć zdarzają się małe nieścisłości. Warto samemu się przekonać, co oferuje dzisiejsza technologia.

Źródło: Microsoft

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Ile klatek z DLSS FG, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Liczba komentarzy: 14

Komentarze:

Załaduj komentarze

Seeing AI - aplikacja dla niewidomych od Microsoftu trafia na Androida. Sztuczna inteligencja pozwoli im zobaczyć świat

Seeing AI jest dowodem na to, że obecną technologię związaną ze "sztuczną inteligencją" można wykorzystać w praktyczny i przydatny sposób. Aplikację docenią przede wszystkim osoby, które mają problemy ze wzrokiem, ponieważ umożliwi im ona „ujrzenie” wszystkiego, co ich otacza.

ChatGPT Plus - OpenAI wzbogaca multimodalny model. Nowa aktualizacja pozwala chatbotowi na pracę z plikami

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Powiązane publikacje

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Ile klatek z DLSS FG, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Komentarze:

Test obudowy komputerowej Corsair Frame 4000D RS - Przewiewna modułowa konstrukcja z kilkoma fajnymi udogodnieniami

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Test płyty głównej ASUS ROG Crosshair X870E Extreme - Kosmiczne wyposażenie w ekstremalnie wysokiej cenie

Test obudowy komputerowej MSI MPG Velox 300R Airflow PZ - Solidna konstrukcja plus wydajne 160 mm wentylatory ARGB

Francuski sąd skazał trzech byłych szefów Ubisoft za molestowanie i mobbing w miejscu pracy

SkyShowtime – filmowe i serialowe nowości VOD na lipiec 2025. Wśród premier Wicked, W garniturach, Sonic 3 oraz Poker Face

Stany Zjednoczone znoszą restrykcje eksportowe na oprogramowanie EDA dla Chin po miesięcznym okresie ograniczeń

G.SKILL CAMM2 DDR5 osiąga stabilne 10000 MT/s na płycie ASUS ROG Maximus Z890 Hero z procesorem Intel Core Ultra 7 265K

Lisa Su, CEO AMD, otrzyma w nagrodę akcje o wartości 33 mln dolarów za sukcesy w rozwoju technologii AI

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

Test kart graficznych AMD Radeon RX 9060 XT vs NVIDIA GeForce RTX 5060 Ti - Waga kogucia doładowana 16 GB pamięci?

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

O portalu PurePC

Najważniejsze

Znajdź PurePC na