timeskz.com
Цифровые технологии и ИИ: как Beeline занял первое место в рейтинге инноваций.

Цифрлық технологиялар мен AI. Beeline қалай инновациялар рейтингінде көшбасшы атанды.

19 қыркүйекте жыл сайынғы Kazakhstan Growth Forum өтті, онда «X20: Қазақстанның ең инновациялық компаниялары» зерттеуі таныстырылды.

Сарапшылар қаржылық көрсеткіштерді, профильді мамандардың саны, клиенттер тәжірибесін және өнімдік инновацияларды бағалады. Рейтингті Beeline Қазақстан басқарды — LTE желісінің ең кең ауқымына ие цифрлық оператор, оны 11 миллион қазақстандық байланыс провайдері ретінде таңдайды. Біз Beeline-ды инновациялар көшбасшысы еткен себептерді зерттеуді шештік.

Тек байланыс операторы емес, IT-компания да

Бүгінде 9 миллионнан астам Beeline клиенттері Beeline цифрлық экожүйесінің қызметтерін пайдаланады: фильмдер көреді, ойындар ойнайды, музыка тыңдайды, сатып алулар үшін төлейді, кредит алады, мәліметтерін бұлттық қызметте сақтайды.

2018 жылы біз интернет-контентті абонентке жеткізетін қарапайым арна болғымыз келмейтінін шештік. Жаңа мақсат қойдық — пайдаланушымен бірге болу және оның өмірін заманауи цифрлық шешімдер арқылы жақсарту. Осылайша біз цифрлық операторға трансформациялануымыз басталды, — дейді Евгений Настрадин, Beeline Қазақстанның CEO-сы.

Жаңа технологиялар әр өнімде бар. Мысалы, биометрия авторизацияны жеңілдетеді және кеңселердегі қызмет көрсету уақытын қысқартады — қағаз бланкілерді толтырудың қажеті жоқ, деректер автоматты түрде тартылады. «Менің Beeline» қосымшасы пайдаланушының қызығушылықтарын талдайды және басты бетті жеке тұлғаға бейімдейді: сәйкес ұсыныстар жоғарыға жылжиды.

60-тан астам ішкі және сыртқы цифрлық өнімдер бір үлкен экожүйеге біріктірілген, ал 750 маманнан тұратын команда оның жұмысын қолдайды және жақсартады. 2023 жылы әзірлеу жаңа деңгейге шықты — QazCode еншілес компаниясы құрылды. Енді сарапшылар Beeline-ға ғана емес, Қазақстандағы және шетелдегі басқа компанияларға да шешімдер әзірлейді. Мысалы, жақында олар GITEX технологиялық стартаптар көрмесінде өз шешімдерін таныстырды.

Өзіміздің әзірлеу командасы болмаса, инновациялық цифрлық компания болу қиын. Дайын вендорлық шешімдер жергілікті ерекшеліктерге бейімделмеген, жиі елеулі өңдеуді қажет етеді. Біз өнімдерді икемді, жылдам және тиімді жасауға мүмкіндік аламыз. Мысалы, биометрия технологиясына негізделген шешіміміз халықаралық NIST (National Institute of Standards and Technology) рейтингінде 500-дің 60-шы орнын алады, — деп түсіндіреді Алексей Шаравар, QazCode CEO-сы.

Чат-боттан ұлттық жасанды интеллектке

2020 жылы Beeline-да Дана атты чат-бот пайда болды. Оның міндеті — абоненттердің оператордың контакт-орталығына қатысуынсыз шешуге болатын сұраныстарына көмектесу. Егер сұрақ қиын болмаса, оператордың босауын күтудің қажеті жоқ — Дана тезірек жауап береді. Мысалы, сіздің трафигіңіз аяқталды, маршрутизаторды қайта жүктейді немесе инциденттің байланыс сапасына әсер ететінін айтады. Сонымен қатар, сіз оған сайтта, «Менің Beeline» қосымшасында, WhatsApp немесе Telegram арқылы жаза аласыз. Егер алғашқы жылы чат-бот 188 мың өтінішті өңдеген болса, бүгінгі күні бұл көрсеткіш 7 миллионнан асады. 97% жағдайда Дана контакт-орталық операторының көмегінсіз жұмыс істейді.

Чат-боттың танымалдығы артқан сайын QazCode командасы жаңа шақырумен бетпе-бет келді. Сұраныстар екі тілде: орыс және қазақ тілдерінде түседі. Сонымен қатар, тіл диалог процесінде өзгеруі мүмкін — көптілді мемлекеттегі қалыпты жағдай. Мұнда қазақ тілінің пайда болуын бақылап, әңгіме контекстін түсінетін шешім қажет болды. Осылайша Kaz-RoBERTA пайда болды — қазақ тіліндегі үлкен тілдік модель және Beeline-ның LLM-дағы алғашқы тәжірибесі.

KazRoBERTA тілдік моделі тек тілдің танылуымен ғана емес, сонымен қатар аудару, жеңілдету, қысқаша мазмұндау, мәтіннің тоналдылығын түсіну қабілетіне ие. Бүгінде жасанды интеллект қазақ тіліндегі барлық клиенттік өтініштердің үштен бірінен астамын өңдейді, бұл айына шамамен 55 мың сұраныс. Жарты жылдық жұмыс барысында миллионнан астам өтінішті өңдеді.

KazRoBERTA-ны HuggingFace-те ашық қолжетімділікте табуға болады. Ресурс пайдаланушылары оны 3 000-нан астам рет жүктеді.

KazRoBERTA-мен тәжірибе бізді келесі қадамға — толыққанды KAZ - LLM құруға шабыттандырды. Көптеген ИИ жүйелері халықаралық тілдер үшін әзірленген: ағылшын, испан, қытай. Бұл аз таралған тілдік топтар үшін цифрлық алшақтықты тудырады. Біз қазақстандықтар үшін мәдени ерекшеліктерді түсінетін өз GPT болуын қалаймыз, тілдік кедергі болмайды, — дейді Алексей Шаравар.

Алайда, осындай ауқымды жобаны бір компания шеңберінде жүзеге асыру қиын, сондықтан Beeline пікірлестерін тапты. Қазіргі уақытта QazCode мамандары Назарбаев университетінің (ISSAI NU) Ақылды жүйелер және жасанды интеллект институтының жұмыс тобымен бірге KAZ-LLM құру бойынша жұмыс істеп жатыр.

Қазақ GPT-ны қалай жаттықтырады

Алексейдің айтуынша, тапсырманы сәтті орындау үшін команда бірнеше шақырумен бетпе-бет келуі керек. Біріншісі — модельді оқыту үшін деректер базасы. Ол әр түрлі мақсат, күрделілік және стильдегі мәтіндерден тұрады. Олар жасанды интеллект үшін түсінікті токендер жүйесіне аударылады. 1 токен кәдімгі мәтіндегі 2, 4 немесе одан да көп символдарды қамтуы мүмкін. Токендер саны неғұрлым көп болса, ИИ-ның контексті түсінуі мен тілге ие болуы соғұрлым артады. Бұл цифрлық алшақтықтың бір себептерінің бірі — әлемде қазақ тілінен гөрі ағылшын тіліндегі мәтіндер әлдеқайда көп. Сондықтан соңғыларын мұқият жинап, таңдау қажет. KAZ-LLM үшін 20 миллиард токен жиналды, бұл шамамен 200 000 орташа кітаптың мазмұнымен пара-пар.

Келесі шақыру — модельді жаттықтыру, оның барысында жасанды интеллект барлық жиналған деректерді талдайды, заңдылықтарды және себеп-салдарлық байланыстарды іздейді. Дәл осы кезең контекстті түсінуге мүмкіндік береді: Beeline сөзін көргенде, ИИ байланыс операторы екенін түсінеді. Бұл процесс шамамен 50 күн бойы үздіксіз есептеулерді қажет етеді және үлкен техникалық қуаттарды талап етеді. Сондықтан Beeline жұмыс тобына үлкен деректермен жұмыс істеуге арналған серверлерді, соның ішінде машиналық оқыту және жасанды интеллект үшін берді.

Салыстыру үшін : кәдімгі компьютерге 1 миллион фотосуретті талдау үшін бірнеше күн қажет. Ал KAZ-LLM жаттығу жүргізілетін 8 DGX H100 оны бірнеше секундта аяқтайды