Huawei slipper HiAI-motoren med Huawei P20

Huawei lanserte Mate 10-serien i oktober med HiSilicon Kirin 970 system-på-brikke. Kirin 970 har spesielt dedikert maskinvare for AI, i form av en Neural Processing Unit (NPU). Forrige måned viste vi også hvordan Huawei utviklet HiAssistant (drevet av HiAI), en Google Assistant + Google Lens-konkurrent for det kinesiske markedet. Nå har Huawei gitt ut HiAI-motoren sammen med Huawei P20.

HiAI er Huaweis AI databehandlingsplattform. For øyeblikket brukes den dedikerte NPU på Kirin 970-telefoner for funksjoner som sanntidsobjekter og scenegjenkjenning i kameraappen, samt akselerert offline oversettelse i Microsoft Translator. Imidlertid er disse mulighetene en liten del av det totale potensialet for maskinlæring og nevrale nettverk. Det er rimelig å si at det ennå er tidlige dager for AI i smarttelefoner, men de potensielle mulighetene er lovende.

I følge Huawei åpner HiAI Engine applikasjonsmuligheter, integrerer "en rekke AI-funksjoner og apper [som gjør] appene mer intelligente og kraftige." Utviklere kan nå laste ned DDK (Driver Development Kit), SDK og IDE for HiAI-motor.

Brukeregenskapene til HiAI-motoren inkluderer en Computer vision (CV) -motor. En Computer Vision-motor refererer til "evnene som datamaskiner simulerer det menneskelige visuelle systemet for å føle det omgivende miljø, og bestemme, gjenkjenne og forstå romets sammensetning, " ifølge Huawei. Funksjonene til CV-motoren inkluderer Image Super Resolution, Facial Recognition og Object Recognition (som blir forklart nærmere nedenfor).

HiAI-motoren inkluderer også en automatisk talegjenkjenning (ASR) motor. Det er imidlertid ikke åpent utenfor Kina. En ASR-motor er det som konverterer menneskelig stemme til tekst, og dens funksjoner inkluderer talegjenkjenning, talekonvertering og tekst-til-tale (TTS).

En naturlig språkforståelsesmotor (NLU) -motor er også en del av funksjonene til HiAI-motoren, men i likhet med ASR-motoren er den ikke åpen utenfor Kina. Det gjør det mulig for datamaskiner å forstå menneskets stemme, som lar dem utføre kommunikasjon eller naturlige handlinger. Funksjonene inkluderer orddeling, tekstgjenkjenning, følelsesmessig tendensanalyse og maskinoversettelse.

Funksjonene i HiAI Engine er:

  • Scenedeteksjon : Den "kategoriserer" bilder raskt ved å gjenkjenne scenene i innholdet i bildet. Huawei uttaler at gjenkjennelse av flere typer scener i dag støttes med høy nøyaktighet.
  • Dokumentretting og dokumentdeteksjon: Det er en assistentforbedringsfunksjon som kan korrigere vinkelen på dokumentet. Den kan også automatisk gjenkjenne posisjonsinformasjonen til dokumentet i bildet.
  • Ansiktsgjenkjenning og ansiktssammenligning : Huawei sier: "Ved ansiktsgjenkjenning blir informasjon om lokasjonen, karakteristiske punkter og holdninger av det menneskelige ansiktet i et gitt bilde oppdaget, og rektangulære ansikts med høy presisjon blir returnert."
  • Bildekategorimerking: Den identifiserer informasjon som objekter, scener og oppførsel i et bilde på grunnlag av den dype læringsmetoden.
  • Image Super Resolution : Det sies å intelligent forstørre et bilde basert på dyp læring. Det kan også undertrykke gjenstander, mens oppløsningen holdes uendret for et tydeligere og skarpere bilde.
  • Tegnbilde Superoppløsning : Det kan forstørre et bilde med tegn på ni ganger. Det kan også "forbedre" definisjonen av karakterene på bildet.
  • Kodedeteksjon: Ifølge Huawei, “Kodedeteksjon leser koder for hurtig respons (QR) og strekkoder for å få informasjon som er inkludert i kodene, og gir dermed relaterte tjenester senere. Muligheten for kodedeteksjon er integrert i applikasjoner. "

Utviklere kan nå laste ned DDK, SDK og IDE til HiAI Engine via kildelinkene.

Takk til medlem Evolutios for tipset!


Kilde: HuaweiSource 2: HuaweiSource 3: Huawei