मुख्य नाविन्य गूगल एआय आता वापरकर्त्यांना फोन कॅमेर्‍यासह 27 भाषांमध्ये त्वरित मजकूर भाषांतर करू देते

गूगल एआय आता वापरकर्त्यांना फोन कॅमेर्‍यासह 27 भाषांमध्ये त्वरित मजकूर भाषांतर करू देते

कोणता चित्रपट पहायचा?
 
(जीआयएफ: गूगल)

(जीआयएफ: गूगल)



कृत्रिम बुद्धिमत्तेबद्दल धन्यवाद, परदेशात प्रवास करणे कधीही सोपे नव्हते.

Google भाषांतर अ‍ॅप वापरकर्त्यांना त्वरित मजकूराचे भाषांतर करू देते. अ‍ॅपमध्ये, आपण अनुवाद करू इच्छित मजकूरावर फक्त आपला कॅमेरा दर्शवा आणि आपल्याला तो आपल्या डोळ्यासमोर थेट आपल्या इच्छित भाषेत रूपांतरित होताना दिसेल - इंटरनेट कनेक्शन किंवा सेल फोन डेटा आवश्यक नाही. हे सुलभ वैशिष्ट्य काही काळासाठी उपलब्ध आहे, परंतु ते केवळ सात भाषांशीच अनुकूल होते. आता , मशीन लर्निंगबद्दल धन्यवाद, Google ने त्वरित 27 भाषांचे भाषांतर करण्यासाठी अॅपचे श्रेणीसुधारित केले.

म्हणून पुढच्या वेळी जेव्हा आपण प्रागमध्ये असाल आणि मेनू वाचू शकणार नाही, तेव्हा आम्ही आपल्याकडे परत आलो आहोत, Google वरील सॉफ्टवेअर अभियंता ओटाव्हिओ गुड, कंपनीच्या संशोधनावर लिहिले ब्लॉग .

Google ने त्यांच्या भाषण ओळख त्रुटींना अर्ध्यावर कपात करण्यासाठी फक्त एआय चा वापर केला.

आजपर्यंत, इंग्रजी, फ्रेंच, जर्मन, इटालियन, पोर्तुगीज, रशियन आणि स्पॅनिश भाषांतर करण्याव्यतिरिक्त, खालील 20 भाषांमध्ये रीअल टाइममध्ये देखील भाषांतरित केले जाऊ शकते: बल्गेरियन, कॅटलान, क्रोएशियन, झेक, डॅनिश, डच, फिलिपिनो, फिनिश, हंगेरियन, इंडोनेशियन, लिथुआनियन, नॉर्वेजियन, पोलिश, रोमानियन, स्लोव्हाक, स्वीडिश, तुर्की आणि युक्रेनियन. आणि आपण मजकूर अनुवादित लाइव्ह पाहण्याऐवजी चित्र स्नॅप करणे निवडल्यास, एकूण 37 भाषा समर्थित आहेत.

तर मग उपलब्ध भाषांची संख्या वाढविण्यात Google सक्षम कसे होते? यापूर्वी त्यांनी वर्ड लेन्स मिळविले, पूर्वी वाढवलेला रिअलिटी ट्रान्सलेशन applicationप्लिकेशन, आणि अ‍ॅपची क्षमता वाढविण्यासाठी मशीन लर्निंग आणि कॉन्व्होल्यूशनल न्यूरल नेटवर्कचा वापर केला. प्रतिमा ओळख प्रगती की होते.

पाच वर्षांपूर्वी, जर आपण संगणकास मांजरीची किंवा कुत्रीची प्रतिमा दिली असेल तर ती कोणती आहे हे सांगण्यात अडचण आली. कॉन्व्होल्यूशनल न्यूरल नेटवर्क्सचे आभार, संगणक मांजरी आणि कुत्री यांच्यातच फरक सांगू शकत नाही तर कुत्र्यांच्या विविध जाती ओळखू शकतात, असे श्री गुड म्हणाले. होय, ते फक्तपेक्षा अधिक चांगले आहेत ट्रिपी कला You आपण परदेशी मेनूचे भाषांतर करत असल्यास किंवा Google च्या भाषांतर अ‍ॅपच्या नवीनतम आवृत्तीसह साइन इन करत असाल तर आपण आता एक खोल मज्जासंस्था वापरत आहात.

क्रमाक्रमाने

पहिला , भाषांतरात पार्श्वभूमी गोंधळ घालणे आणि मजकूर शोधणे आवश्यक आहे. जेव्हा ते त्याच रंगाच्या पिक्सेलचे ब्लॉब शोधतात तेव्हा ते अक्षरे आहेत हे निर्धारित करते. आणि जेव्हा ते ब्लॉब एकमेकांच्या जवळ असतात तेव्हा हे समजले जाते की ती सतत वाचनीय आहे.

पुढे, अॅपला प्रत्येक स्वतंत्र पत्र काय आहे हे ओळखणे आवश्यक आहे. येथेच सखोल शिक्षण येते.

आम्ही कॉन्व्होल्यूशनल न्यूरल नेटवर्क वापरतो, त्यास अक्षरे आणि अक्षरे नसलेले प्रशिक्षण देतो जेणेकरुन ती भिन्न अक्षरे कशा दिसतात हे शिकू शकेल, ब्लॉग पोस्ट वाचते.

संशोधकांना फक्त स्वच्छ दिसणारी अक्षरेच नव्हे तर गलिच्छ अक्षरे वापरुन सॉफ्टवेअरचे प्रशिक्षण द्यावे लागले. ख world्या जगातील पत्रे प्रतिबिंब, घाण, कचरा आणि सर्व प्रकारच्या विचित्रतेमुळे विस्मयकारक ठरतात, श्री गुड लिखित. म्हणून आम्ही वास्तविक जगातील कोलाहल - नकली प्रतिबिंब, बनावट धुमाकूळ, बनावट विचित्रपणा या सर्व गोष्टींची नक्कल करण्यासाठी सर्व प्रकारचे बनावट घाण तयार करण्यासाठी आम्ही आमच्या जनरेटरची निर्मिती केली. काही

प्रशिक्षणासाठी वापरलेली काही घाणेरडी अक्षरे. (फोटो: गूगल)








तिसऱ्या भाषांतर मिळविण्यासाठी चरण शब्दकोषातील मान्यताप्राप्त अक्षरे पहात आहे. आणि अचूकतेच्या अतिरिक्त प्रयत्नासाठी, शब्दकोश एस दृष्टीक्षेप अंदाजे आहेत जर एस 5 म्हणून चुकीचा वाचला गेला असेल.

शेवटी, अनुवादित मजकूर त्याच शैलीत मूळच्या वर प्रस्तुत केला जातो.

आम्ही हे करू शकतो कारण आम्हाला आधीपासूनच प्रतिमेमधील अक्षरे सापडली आहेत आणि वाचली आहेत, म्हणून आम्हाला माहित आहे की ते कोठे आहेत. आपण अक्षरांच्या आसपासचे रंग बघू शकतो आणि मूळ अक्षरे मिटवण्यासाठी वापरू शकतो. आणि मग आम्ही ब्लॉगच्या अग्रभागातील मूळ रंगाचा वापर करुन भाषांतर वर काढू शकतो.

शक्य तितक्या कार्यक्षम होण्यासाठी आणि या सर्व चरणांना इंटरनेट किंवा डेटा कनेक्शनशिवाय रिअल टाइममध्ये पूर्ण करण्याची अनुमती देण्यासाठी, Google कार्यसंघाने हाताळू शकते अशा माहितीच्या घनतेवर वरच्या बाउंडसह एक अतिशय लहान मज्जातंतू तयार केले. ते त्यांचा स्वतःचा प्रशिक्षण डेटा तयार करीत असल्याने, योग्य डेटा समाविष्ट करणे महत्त्वाचे होते परंतु अतिरिक्त काहीच नव्हते म्हणून मज्जासंस्थेचे नेटवर्क बिनमहत्त्वाच्या गोष्टींवर आपली जास्त माहिती घनता वापरत नाही. थोड्या प्रमाणात रोटेशन असलेले पत्र कसे ओळखावे हे त्याचे उदाहरण आहे, परंतु जास्त नाही.

शेवटी, वापरकर्त्यांकडे 20 आणखी भाषा परंतु समान वेगवान शिल्लक आहेत.

हे देखील पहा: Google च्या एआय टीमने त्यांच्या मशीन लर्निंग रिसर्चचे आम्हाला कमी केले

आपल्याला आवडेल असे लेख :