सन् १५०० यता विभिन्न भाषामा प्रकाशित भएका किताबहरुलाई गुगलले डिजिटाइज गरेर गुगल बुक्समा राखिदिएकोछ । ती पुराना एतिहासिक किताबहरुलाई ओसिआर, रिक्याप्चा आदि प्रविधिव्दारा गुगलले डिजिटाइज गर्दै आएकोछ । विकिपेडियाका अनुसार सन् १५०० देखि सन् २००८ सम्ममा प्रकाशित भएका करिब ५२ लाख किताबहरु गुगलले डिजिटाइज गरेर गुगल बुक्समा उपलब्ध गराएकोछ ।
ती डिजिटाइज गरिएका ५२ लाख किताबहरुमा रहेका अक्षर, शब्दहरु आदिको संख्या गुगल एनग्राम (ग्राफ) मा हेर्न सकिन्छ । विभिन्न भाषा तथा शब्दहरुमा रुची राख्नेका लागि गुगल एनग्राम उपयोगी रहेकोछ । गुगल एनग्राम मा कुन शब्द कहिले देखि प्रयोग गर्न थालियो, कुन समयमा धेरै प्रयोग गर्न थालियो, किन प्रयोग गरियो, कुन शब्द कहिले उत्तपति भयो भन्ने जस्ता विभिन्न जिज्ञासाहरुको समाधान भेट्न सकिन्छ ।
जस्तो कि विश्वयुद्द (World war) भन्ने शब्द सन् १९०० पछिका किताबहरुमा देख्न सकिन्छ । सन् १९०० देखि सन् १९५० बिचमा लेखिएका किताबहरुमा "वल्ड वार" शब्द धेरै प्रयोग भएकोछ । (पहिलो विश्वयुद्द सन् १९१४-१८ र दोश्रो विश्वयुद्ध १९३९-४५ मा भएको थियो)
तर गुगल एनग्राममा भएका सबै तथ्य विश्वासिला नहुँदा रहेछन्, ओसिआर प्रविधि सँधै ठिक नहुने रहेछ भन्ने कुरा अंग्रेजी शब्द "फक" बाट थाहा पाइयो । यसका अतिरिक्त गुगल एनग्राममा देखिएको "फक" शब्दबाट अक्षरहरुको बनोट र अक्षरहरुमा आएका परिवर्तनहरुका बारेमा पनि जान्न पाइयो ।
गुगल एनग्राममा "फक" शब्दको खोजी गर्दा निकै आश्चार्यजनक नतिजा देखियो । "Fuck" भन्ने शब्द सन् १६२० देखि सन् १८२० सम्मका किताबहरुमा धेरै प्रयोग गरेको पाइयो । सन् १८२० देखि सन् १९६० मा "फक" शब्दको प्रभुत्व देखिएन तर फेरि पछि सन् १९६० देखि यताका किताबमा उक्त शब्दको प्रयोग गरेको पाइयो ।
गुगल एनग्राम मा देखिएको नतिजाले साँच्चै नै आश्चार्यचकित बनायो । कि गुगल बुक्स गलत छ वा यो शब्द सन् १६०० - १८०० सम्ममा प्रचलनमा थियो र विचमा यो शब्द नै थिएन भन्ने आशंका पनि पैदा गरायो । तर गुगल बुक्समा देखिएको पहिलो नतिजाबाट नै किताबमा प्रयोग गरिएका सबै शब्दहरु "फक" थिएनन् भनेर बुझ्न खासै समय लागेन । तर यसबाट अक्षरहरुको उत्पति र विकासक्रम बारे भने जान्ने मौका मिल्यो ।
माथिको फोटो "जुका" बारे लेखिएको किताबको पृष्ठबाट लिइएको हो । बिचमा पहेँलोले हाइलाइट गरेका शब्दहरु उक्त वाक्यमा मेल खाँदैनन् । त्यहाँ "फक" शब्दको ठाउँमा "सक" हुँदा वाक्य मिलेको देखिन्छ । लेखिएकोछ, "...they shouldfuck suck more blood then they are able to contain, cut off their tails as they fuck suck..." माथि भएका प्राय: सबै वाक्यमा तपाईलाई "फक" लेखिएको जस्तो लाग्नसक्छ र गुगलबुक्सले पनि अधिकांश शब्दहरु त्यसरी नै बुझ्छ । तर वास्तविकतामा "फक" नहुनसक्छ । तपाईलाई "फक" शब्द हो भन्ने लागेका ठाउँमा "सक" (suck) शब्द राखेर पढ्नुस् केही फरक भेट्नुभयो कि?
खासमा यी कुराहरु अंग्रेजी अक्षरको बनोट र विकासक्रमसँग जोडिएका रहेछन् । सन् १५०० देखि १८०० सम्म अंग्रेजी अक्षरहरु "f" र "s" उस्तै उस्तै देखिने र लेखिने रहेछ । "f" मा माथिल्लो भागमा सानो ड्यास (-) ले मात्र "s" र "f" को फरक छुट्टिने कारण दुवै शब्द उस्तै उस्तै देखिने रहेछन् । तर समयसँगै विस्तारै परिवर्तन हुँदै अहिले यसरी "s" र "f" लेखिन्छ । अर्थात अहिले यी दुवै शब्दहरु विलकुल फरक देखिन्छन् । तर गुगलले किताब डिजिटाइज गर्न प्रयोग गरेको प्रविधिले पहिलेका अक्षरहरुका वनौट ठम्याउन नसकेको देखिन्छ ।
माथिका ग्राफहरु गुगल एनग्रामबाट लिइएकाहुन् । तपाई यस विषयमा अझै अध्ययन गर्न चाहनुहुन्छ भने, गुगल एनग्राममा गएर शब्दहरु सँग खेल्न सक्नुहुन्छ, गुगल बुक्समा किताबहरु हेर्नसक्नुहुन्छ । नयाँ कुरा भेट्नुभयो भने तल कमेन्ट लेख्न नभुल्नुहोला ।
(केही हप्ता पहिले काठमाडौँमा आयोजना गरिएको "वल्ड स्टार्टअप रिपोर्ट" को कार्यक्रम पछि विविध विषयमा छलफल हुँदैथियो । कुरा गर्दै जाँदा हामी पुराना "अक्षर" र "शब्दको बनोट" मा पुग्यौँ । स्टार्टअप रिपोर्टमा आएका अजयबाट अनौठो कुरा थाहा पाइयो, अंग्रेजी शब्द "फक"को बारेमा । अनि गुगल एनग्राममा आएर खोजी गरियो। धन्यवाद !)
ती डिजिटाइज गरिएका ५२ लाख किताबहरुमा रहेका अक्षर, शब्दहरु आदिको संख्या गुगल एनग्राम (ग्राफ) मा हेर्न सकिन्छ । विभिन्न भाषा तथा शब्दहरुमा रुची राख्नेका लागि गुगल एनग्राम उपयोगी रहेकोछ । गुगल एनग्राम मा कुन शब्द कहिले देखि प्रयोग गर्न थालियो, कुन समयमा धेरै प्रयोग गर्न थालियो, किन प्रयोग गरियो, कुन शब्द कहिले उत्तपति भयो भन्ने जस्ता विभिन्न जिज्ञासाहरुको समाधान भेट्न सकिन्छ ।
जस्तो कि विश्वयुद्द (World war) भन्ने शब्द सन् १९०० पछिका किताबहरुमा देख्न सकिन्छ । सन् १९०० देखि सन् १९५० बिचमा लेखिएका किताबहरुमा "वल्ड वार" शब्द धेरै प्रयोग भएकोछ । (पहिलो विश्वयुद्द सन् १९१४-१८ र दोश्रो विश्वयुद्ध १९३९-४५ मा भएको थियो)
तर गुगल एनग्राममा भएका सबै तथ्य विश्वासिला नहुँदा रहेछन्, ओसिआर प्रविधि सँधै ठिक नहुने रहेछ भन्ने कुरा अंग्रेजी शब्द "फक" बाट थाहा पाइयो । यसका अतिरिक्त गुगल एनग्राममा देखिएको "फक" शब्दबाट अक्षरहरुको बनोट र अक्षरहरुमा आएका परिवर्तनहरुका बारेमा पनि जान्न पाइयो ।
गुगल एनग्राममा "फक" शब्दको खोजी गर्दा निकै आश्चार्यजनक नतिजा देखियो । "Fuck" भन्ने शब्द सन् १६२० देखि सन् १८२० सम्मका किताबहरुमा धेरै प्रयोग गरेको पाइयो । सन् १८२० देखि सन् १९६० मा "फक" शब्दको प्रभुत्व देखिएन तर फेरि पछि सन् १९६० देखि यताका किताबमा उक्त शब्दको प्रयोग गरेको पाइयो ।
गुगल एनग्राम मा देखिएको नतिजाले साँच्चै नै आश्चार्यचकित बनायो । कि गुगल बुक्स गलत छ वा यो शब्द सन् १६०० - १८०० सम्ममा प्रचलनमा थियो र विचमा यो शब्द नै थिएन भन्ने आशंका पनि पैदा गरायो । तर गुगल बुक्समा देखिएको पहिलो नतिजाबाट नै किताबमा प्रयोग गरिएका सबै शब्दहरु "फक" थिएनन् भनेर बुझ्न खासै समय लागेन । तर यसबाट अक्षरहरुको उत्पति र विकासक्रम बारे भने जान्ने मौका मिल्यो ।
माथिको फोटो "जुका" बारे लेखिएको किताबको पृष्ठबाट लिइएको हो । बिचमा पहेँलोले हाइलाइट गरेका शब्दहरु उक्त वाक्यमा मेल खाँदैनन् । त्यहाँ "फक" शब्दको ठाउँमा "सक" हुँदा वाक्य मिलेको देखिन्छ । लेखिएकोछ, "...they should
खासमा यी कुराहरु अंग्रेजी अक्षरको बनोट र विकासक्रमसँग जोडिएका रहेछन् । सन् १५०० देखि १८०० सम्म अंग्रेजी अक्षरहरु "f" र "s" उस्तै उस्तै देखिने र लेखिने रहेछ । "f" मा माथिल्लो भागमा सानो ड्यास (-) ले मात्र "s" र "f" को फरक छुट्टिने कारण दुवै शब्द उस्तै उस्तै देखिने रहेछन् । तर समयसँगै विस्तारै परिवर्तन हुँदै अहिले यसरी "s" र "f" लेखिन्छ । अर्थात अहिले यी दुवै शब्दहरु विलकुल फरक देखिन्छन् । तर गुगलले किताब डिजिटाइज गर्न प्रयोग गरेको प्रविधिले पहिलेका अक्षरहरुका वनौट ठम्याउन नसकेको देखिन्छ ।
माथिका ग्राफहरु गुगल एनग्रामबाट लिइएकाहुन् । तपाई यस विषयमा अझै अध्ययन गर्न चाहनुहुन्छ भने, गुगल एनग्राममा गएर शब्दहरु सँग खेल्न सक्नुहुन्छ, गुगल बुक्समा किताबहरु हेर्नसक्नुहुन्छ । नयाँ कुरा भेट्नुभयो भने तल कमेन्ट लेख्न नभुल्नुहोला ।
(केही हप्ता पहिले काठमाडौँमा आयोजना गरिएको "वल्ड स्टार्टअप रिपोर्ट" को कार्यक्रम पछि विविध विषयमा छलफल हुँदैथियो । कुरा गर्दै जाँदा हामी पुराना "अक्षर" र "शब्दको बनोट" मा पुग्यौँ । स्टार्टअप रिपोर्टमा आएका अजयबाट अनौठो कुरा थाहा पाइयो, अंग्रेजी शब्द "फक"को बारेमा । अनि गुगल एनग्राममा आएर खोजी गरियो। धन्यवाद !)
Comments
Post a Comment