Журналистің жұмысы жеңілдейді
Бүгінде технология көз ілеспес жылдамдықпен қарыштап дамып жатыр. Көптеген салада жасанды интеллект адам өмірін жеңілдетіп, инновациялық жобалар заманның талабына тиісті дәрежеде жауап беруде. Осыдан жарты жыл бұрын «Astana Hub» ІТ-стартаптар халықаралық технологиялық паркі «TechOrda» бағдарламасын іске қосқан еді. Мұның жарқын жемісі көп күттірген жоқ. Бірнеше жоба жүзеге асты.
Жуырда жазу-сызуға жақын адамдардың, әсіресе, журналистер қауымының көңілінен шығатын ерекше жобаның бета-нұсқасы пайда болды. Негізгі мамандығы техник-бағдарламашы Елдар Құдайбергенов «Transcribe.kz» деп аталатын қазақ тіліндегі жобаны бастады. Ол бағдарлама арқылы ұзақтығы әртүрлі аудионы 95 пайызға дейінгі дәлдікпен мәтінге айналдыруға мүмкіндік бар. Осы ақжолтай жаңалықты ести сала жоба авторымен тілдесіп, жоба туралы толығырақ түсіндіріп беруін сұрадық.
Тегін курстың пайдасы
– Елдар, transcribe.kz жобасын жасау туралы идея қалай пайда болды?
– Бұл идеяның туындауына бірнеше фактор әсер етті. Соның барлығы бір жерге тоғысқан кезде ғана идея туады. Менің техник-бағдарламашы және заңгер мамандықтарым болса да, бағдарламалық код жазумен айналысқан жоқпын. Бағдарламашы ретінде көбінесе сайт жасап, серверлерді қолданумен аз ғана уақыт айналысқаным болмаса, аса көп ден қойып жұмыс істеген жоқпын. Ал, заңгерлік салада біршама тәжірибем бар.
Жаңа жобаның дүниеге келуіне ең алғашқы фактор менің бағдарламашы ретінде оқығаным, тиісінше осы салада техникалық бэкграундымның болғаны деп ойлаймын. «Astana Hub» ІТ-стартаптар халықаралық технологиялық паркі іске қосқан «TechOrda» бағдарламасы бойынша бағдарламашы курсына тегін қатысып, Web бағдарламасының Frontend бағытын таңдадым. Оқып жүргенде, оқытушымыз «жай ғана келіп-кетіп жүргеннен гөрі, өздеріңіз бір жоба ойластырып көріңіздер» деген ұсыныс айтты. Ол кезде басқа бір жобаны ойлап, соны жасап жүргенмін. Сонымен қатар, кәсіби подкастер болған соң, продюсер ретінде мекемелерге подкаст жасап көрсетіп, бұл жұмысымды да қатар алып жүрдім.
Бірде журналист клиентіммен сөйлесіп отырған кезде оның жазып алған сұхбатын алдымен қағазға түсіріп, оны компьютерге теріп, содан соң ғана редакциялайтынын білдім. Басқа да әріптестердің онлайн транскрипция құралдарын қолданатынын көріп жүретінмін. Содан жағдайдың қиын екенін біліп, журналист әріптеске «осындай дүние жасап көрсем қолданасыз ба?» деп сұрадым. Ол қуана қолдады. Осылайша, ізденіс басталды. Бұл туралы ойымды мұғаліміммен бөлісіп едім, ол кісі бірден қолдау білдірді.
Менің жолдасымның да мамандығы – журналист. Бұрын газет-журналдарда тілші болып, кейін интернет-порталдарда жұмыс істеді. Ол жерлерде long read (ұзақ текст) жазып, сұхбаттар жариялайды. Ол да осындай транскрипция болғанын қалап жүретін. Бірақ, отау көтерген соң аз уақыттан кейін декреттік демалысқа шықты да, бұл жұмысының қиындығын аса көп көрген жоқпын. Дегенмен, сол жылдары жолдасыма аудионы мәтінге айналдырып беретін бір-екі жоба жасап, мәтінін қағаз бетіне қазақ, орыс тілдерінде түсіріп бергенім бар. Алғаш рет қолданған соң ба, ол жобаның сапасы маған ұнаған жоқ. Сондықтан, оны нарыққа шығарып, қолданысқа енгізуге ұялдым. Оның үстіне қазіргідей бел шешіп қолға алған жоқ едім…
Осы жолы бағдарлама жазуды оқып, ІТ-ді меңгеріп жатқандықтан клиенттердің де сұранысы бар екенін көрдім. Мен кезіктірген бірнеше адам нарықта бұдан басқа да жобалар болғанымен, көңіл көншітпейтінін айтты. Осылайша, қазақ тіліндегі ұзақтығы әртүрлі аудионы 95 пайызға дейін дәлдікпен қалай мәтінге айналдыруға болатынын ізденіп, жасағым келді. Қажет файлдарды бір талдап емес, топтап жіберуге болады. Әзірге бір жүктегенде 5 файлды (аудио, видео) бірден жүктеуге болады. Әр файлдың көлемі көп дегенде 1 гигабайттан аспағаны абзал. Сонда бір жолдағанда барлық файлдың көлемі 5 гигабайтқа дейін болады. Сайттың құпиялылығы да ескеріледі. Сайтқа жолданған аудиоларды мәтінге айналдыру үшін қолданады да, транскрипция жасалған соң аудио жойылады. Ал, дайын мәтін doc пішімінде (формат) бірден электронды поштаға жөнелтіліп, кейін серверден жойылады. Жоба әлі толық автоматтандырылмаған. Бағдарламашылар тобын құрып жатырмыз. Оның ішінде бағдарламалауды мықты білетін маман бар, сол кісі жұмысымызды көріп жүр.
Алдағы уақытта нарыққа толығымен автоматтандырып шығармақпыз. Сайттың жұмысын толығымен автоматтандырып, тіркелген соң сайтта қолданушының теңгерімі (баланс) болады. Соған өзінің қалаған сомасын салып қояды да, осы қызмет түрін қалауынша қолдана береді. Осылайша, сайтқа аудионы тікелей жүктеп, дайын мәтінді бірден алатындай етуді көздеп отырмыз. Кем дегенде бір айдың көлемінде осы жобаны ұсынғымыз келіп отыр.
Қазақ тілі – технология тіліне айналады
– Келешекте жобаға қандай жаңашылдық енгізу ойыңызда бар?
– Жаңашылдық туралы айтар болсақ, идея өте көп. Мен бір мәселе туындаса, оның шешімін ұсынуға, табуға тырысамын. Әзірге жоба бета-нұсқада болғандықтан, ұзақ жазбалардың транскрипциясын жасау көбірек уақыт алады. Алдағы уақытта біздің мақсатымыз – бұл қызметті ешбір адамның қатысуынсыз автоматтандырып, қолданушылар аудионы жүктеп, мәтінге қол жеткізе алатындай деңгейге жеткізу.
Қазір мәтін аудионы сайтқа жүктеген соң бірнеше сағаттан кейін дайын болады. Аудионың бір минуты да қымбат емес, сапалы транскрипт үшін 33 теңге қолжетімді деп ойлаймын. Айтпақшы, транскрипт сапасы жүктелетін аудионың сапасына тікелей байланысты, қолданушылар осыны да ескерулері қажет. Жобам қазір минималды өміршең өнім (MVP. minimum viable product) режимінде жұмыс істеп тұр. Сондай-ақ, қазіргі бағаны да сақтап қалуға тырысып жатырмыз.
Айталық, журналист сұхбат алып, оның мәтінін шығару керек болса, ақысын редакция төлейтіндей етуді де көздеп отырмыз. Ол үшін редакция бізбен келісім-шартқа отырады. Сондай-ақ, кейбір адамдар аудионы телефонына жазып, оны сақтап, телефоннан жүктемей бірден аудиосын жіберіп, мәтін күйінде алғанын қалайды. Бұл артық іс-әрекетсіз, уақыт үнемдеуге де тиімді. Бұдан бөлек, видеоны әр 30 секунд немесе минут сайын тайм-кодтап, титр секілді қылу да ойда бар. Сонымен қатар, онлайн немесе офлайн арқылы өтіп жатқан жиналыста шетел тілінде сөйлеп жатқан спикердің сөзін құлаққап (наушник) арқылы бірден қазақ тіліне аударып отыратындай етіп жасауды да көздеп отырмыз. Әзірге бұл жоба 100 пайыз адам секілді аудара алмасы анық. Бұл болашақтың еншісіндегі дүние.
Егер жоба жемісті жүзеге асса, адамдар ақпаратты өзінің қалаған тілінде қабылдап, қазақ тіліндегі конференцияларды басқа тілдерге тарата алатындай да мүмкіндік бар. Айталық, жылда болатын қазақ тілді медиалардың жиналысын тікелей көрсетілім жасап, ағылшын тілінде тарататын болсақ, халықаралық деңгейге шығамыз. Бұл – адамның қолынан келетін дүние. Ол үшін алдымен уақыт және қаражат қажет.
– Елдар, расында сіз айтып отырған дүниенің барлығы жүзеге асса, біраз дүние жеңілдейін деп тұр екен. Енді осы жобаңыздың мемлекет тарапынан қолдау тауып, субсидия бөлінуіне жұмыстанып көру туралы ойламадыңыз ба?
– Менің ойымша, мұның бәрін нарық өзі реттеп, шешеді. Егер осы жобаны нарықта қажеттігін сезініп, қолданып жатса ол әрі қарай дами беретіні сөзсіз. Болашақта бәсекелестік те пайда болып, осы жобаны қолданатын кез-келген адамның да идеялары туындауы мүмкін. Жуырда бір танысым мәтінді аудиоға айналдыру туралы да ойын айтты. Бір қызығы, біз мұны да жасай аламыз.
Қазақ тілі – шалғайда жатқан, қолданыс аясы тар тіл деп ойламауымыз керек. Оны интернетте технологиялармен жұмыс істей алатын тілге айналдыруға болады. Бағдарламашылар осы бағытта да көп жұмыстар атқара алады. Қазір көпшілік қазақ тілі арқылы осындай жоба жасауға болатынына таңданып жатқандар бар. Бұл жобаны қолдаудың ең мықты жолы – осы жобаны өздеріңіздің жұмыстарыңызда қолдану.
– Жоғарыда кәсіби подкастер екеніңізді де айтып қалдыңыз, бұл салаға қалай келдіңіз?
– Басында айтқанымдай, біраз жұмыстың басын қайырып, подкастинг саласына ауыстым. Қазақстанда осы саланы дамытып, сол мәселе бойынша жұмыс істеп келемін. Қазақстан подкастарының агрегаторын жасадым.
Бұдан екі-үш жыл бұрын қазақ тіліндегі алғашқы тегін онлайн курс жасап шығарып, сайтқа салып қойдым. Әлі күнге дейін адамдар сайттан қарап, курстан өте алады. Сондай-ақ, екі жыл қатарынан Қазақстан подкастерлерінің құрылтайын өткізіп жүрмін. Биыл үшіншісін өткізу жоспарда бар. Жеке подкастарым да бар.
Соңғы сәтті шыққан подкастарымның бірі «Қаңтар үні» деп аталады. Былтыр 5 қаңтарда Алматы әуежайында не істерін білмей, топырлаған халықтың арасында біздің отбасымыз да болды. Сол сұмдықтан отбасымды қалай алып шыққаным туралы сол подкастта айттым.
– Елдар мырза, осындай жобаны армандамаған журналист әріптестеріміз жоқ шығар. Жобаның жолы болсын. Алдағы бастамаларыңызға сәттілік тілейміз!
Сұхбаттасқан Алмас ҚАБДОЛОВ