Google lisää OCR-tuki 34 kieltä varten
Google on toiminut jo Oracle-työssä ( OCR ) liiketoiminnassa jo tänään, ja tänään se on päivittänyt tämän ominaisuuden tukemaan 29 uutta kieltä. Syyskuussa 2009 Google osti reCAPTCHA: n, ja siitä lähtien he ovat samanaikaisesti harjoittaneet roskapostia parantaen käännösään ihmisten kirjoittamilla sanoilla. Päivitys, jonka näemme tänään, on niiden toimien hedelmä, joita he ovat tehneet teknologiaa.
Mikä on OCR?
Jos liittymme vain meihin, optisen merkin tunnistus on automaattinen järjestelmä, joka kääntää tekstin kuvan koodatuksi valittavaksi tekstiksi. Google käyttää tekstintunnistusohjelmaa skannaamaan kuvia ja PDF-tiedostoja, ja sitten skannaus muokattavaksi Google Doc -muodoksi. Viimeisten kahden vuoden aikana Google on käyttänyt reCAPTCHA-palapeleihin liittyvää inhimillistä panosta menestystensä lisäämiseksi monimutkaisten sanojen tunnistamisessa.
Mitä kieliä on lisätty?
Muita kieliä täydentäen Google paransi myös OCR-laatua viidelle aiemmin toteutetulle kielelle: englanti, italia, saksa, espanja ja ranska. Lisätyt 29 uutta kieltä ovat seuraavat:
1. bulgaria 2. katalaani 3. kiina (yksinkertaistettu han) 4. Kroatia 5. Tšekki 6. tanska 7. Hollanti 8. Filipino 9. suomi 10. kreikka 11. Unkari 12. Indonesialainen 13. japanilainen 14. Korean 15. latvialainen | 16. Liettuan kieli 17. Norja 18. Puolan kieli 19. portugali 20. romania 21. venäjä 22. Serbian 23. slovakki 24. slovenialainen 25. ruotsi 26. Thai 27. Turkkilainen 28. ukraina 29. Vietnam |
Kun lataat kuvia tai PDF-tiedostoja Google-dokumentteihin, muista valita kieli, jonka tiedoston teksti on kirjoitettu! Voit tehdä tiedoston jonoon lähetettäväksi ja valitse sitten Muokkaa tekstiä PDF- tai kuvatiedostoista Google-dokumenttien asiakirjoihin . Näyttöön tulee Document Language -valikko, jossa voit valita kielen.
Oletko kokeillut Googlen OCR-tekniikkaa vanhojen perhelehtien, kirjojen tai minkä tahansa muun talon skannaamisen skannaamiseen? Voit myös kokeilla sitä iPhonessa tai Android-puhelimessa, jos sinulla on Google Goggles -sovellus!