Дүниені дүр сілкіндірген DeepSeek

Уақыт озған сайын дүниежүзінде Жасанды интеллект саласындағы бәсеке қызып келе жатыр. Мысалға айтар болсақ, қазірге дейін АҚШ-Қытай арасындағы сан түрлі текетірестің бірі технология төңірегінде болып келген еді. Олардың қатарында Google, YouTube сынды алпауыттардың саяси себептермен қосарланған шарттарына Бейжіңнің келісім бермеуі салдарынан Қытай нарығынан шығып кетуін атап өтуге болады. Кейінгі «сауда соғысы» тұсында тіпті компьютер, принтер сынды аса қажетті бұйымдарды өндіретін танымал компаниялардың, өндіріс орындарын басқа елдерге көшіріп әкетуі де әлемдік нарыққа кәдімгідей әсер етті. Ал бұдан кейінгі америкалық чиптерді Қытайға сатуға тосқауыл қою мәселесі ортаға шықты. Осы жүріспен Қытайға «мат қойдым» деп екі иығынан дем алып отырған Вашингтонның есебін таяуда Қытайдың елеусіз жүрген DeepSeek атты компаниясы быт-шыт қылып тастады.

Жайлап қана нарыққа енген технологиялық компания соңғы бірнеше күнде Америка Құрама Штаттарындағы ең озық ЖИ үлгілерімен салыстыруға болатын арзан аппараттық құралдарды пайдаланып, DeepSeek деген үлкен жасанды интеллект тіл үлгісін жасап, батыстық технология қауымдастығын таңғалдырды. Таңғалдырғаны былай тұрсын, АҚШ-тың алпауыттарын қыруар шығынға батырған.

ЖИ саласына көңіл бөліп отырған барлық адамды таңғалдырған бұл нендей жаңалық? Артықшылығы неде, кемшіліктен ада ма? Осы сұрақтардың жауабын мағұрып пен мәшүріпті билеп тұрған екі елдің беделді басылымдарына жүгіне отырып іздеп көрдік.

Қытайдан шыққан бұл жаңалықты ЖИ саласына енгізіп отырған компанияның толық атауы Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd деп аталады екен. Ол 2023 жылдың 17 шілдесінде құрылған. Бұл кеңейтілген үлкен тіл үлгілерін (LLM) және оған қатысты технологияларды әзірлеуге бағытталған инновациялық технологиялық компания.

DeepSeek бизнес саласына қажетті техникалық қызметтерді, технологияларды әзірлеумен, бағдарламалық жүйелеумен айналысады екен. 2024 жылдың 5 қаңтарында DeepSeek кеңейтілген үлкен тіл үлгілерін (LLM) дайындап шыққан. Бұл DeepSeek-тің алғашқы үлкен моделі болған. Осыдан кейін компания зерттеушілері DeepSeekMath, DeepSeek-VL қатарлы жаңартылған модельдерді бірінен соң бірін шығара бастайды. Олар 2024 жылы 30 желтоқсанда CITIC Securities Research Report DeepSeek-V3 моделін жасап шығып көпшілікке таныстырған. ЖИ индустриясында кеңінен назар аударғанын бұл модель ЖИ-дың барлық мүмкіндіктерін қамтамасыз ете отырып, оқытудың тиімділігі мен ойлау жылдамдығын айтарлықтай жақсартқан. DeepSeek-тың дүниені шулатып жатқан DeepSeek R1 атты моделі 2025 жылы 20 қаңтарда нарыққа шықты. App Store-ның алаңына шыққан бұл ботты қысқа ғана бірнеше күнде миллиондаған адамдар ұялы телефондарына жүктеп алып пайдалана бастаған.

DeepSeek-R1 – OpenAI компаниясының 01 үлгісімен салыстыруға арналған жаңадан шыққан ашық бастапқы ЖИ моделі. Ол математика, бағдарламалау және дәлелдеу тапсырмаларын жақсы орындайды және оқыту үшін модельдің ойлау қабілетін айтарлықтай жақсартатын кең ауқымды күшейтетін оқыту технологиясын пайдаланады.

DeepSeek-R1 қолданушыларға модельді еркін пайдалануға, өзгертуге және таратуға мүмкіндік беретін MIT лицензиясын қабылдайды. Бұл ашық стратегия әзірлеушілерге модельді әртүрлі қолданбаларды әзірлеу және зерттеу жұмыстары үшін пайдалануға мүмкіндік беретін ғылыми-зерттеу және тәжірибелік-конструкторлық қоғамдастықтың қатысуын ынталандыруға бағытталған.

Өнімділік жағына келгенде DeepSeek-R1 көптеген тапсырмаларды, әсіресе математика мен бағдарламалауды жақсы орындайды екен. Ал оңтайлы тұстарына тоқталар болсақ: үлгіге API арқылы ғана емес, сонымен қатар жергілікті түрде іске қосылуға болады, бұл әзірлеушілерге оны қажеттіліктеріне қарай теңшеуге және оңтайландыруға мүмкіндік береді.

Бұл модель нарыққа шығарылған сәттен бастап қолданушылардың оң бағасына ие болған. Көптеген пайдаланушылар API интерфейстерін пайдалану тәжірибесімен бөлісіп, олардың үнемділігін көрсеткен.

DeepSeek-R1 сонымен қатар көп тапсырманы оқыту мүмкіндігіне ие. Ол бірнеше салада (мысалы, табиғи тілді өңдеу, кескінді тану және т.б.) жақсы жұмыс істеуге мүмкіндік беретін көп тапсырманы оқыту стратегиясын қабылдайды. Бұл тәсіл модельдің жалпылау қабілетін жақсартып қана қоймайды, сонымен қатар оның нақты тапсырмаларға тез бейімделуіне мүмкіндік береді.

Осылайша тым көп қаржы шығындамай-ақ жоғары өнімділікке қол жеткізуге болатындығын айғақтаған DeepSeek, ЖИ саласында әлемнің көшбасшыларының қатарынан табылатын OpenAI және Microsoft сияқты компаниялардың инвестициялық жоспарларын тығырыққа тіреп отыр. OpenAI компаниясының 500 миллиард доллар қаржы жұмсап, озық үлгілерді қолдау үшін үлкен деректер орталықтары болып табылатын Stargate жобасын дайындауға бел байлаған. Осы мақсатта Oracle және Softbank сияқты серіктестердің қолдауымен бұл стратегия ЖИ-да қол жеткізу бұрын-соңды болмаған есептеу ресурстарын қажет етеді деген болжамға келген. Дегенмен DeepSeek AI стартапының R1 тұжырым үлгісінің шығарылымы AI қауымдастығына соққы болып тигендей... OpenAI o1-мен салыстырғанда оның құны небәрі 3%-5% құрайды екен. «Бұл ашық бастапқы модель әзірлеушілерді қызықтырып қана қоймайды, сонымен қатар кәсіпорындарды AI стратегияларын қайта қарауға шақырады», – дейді мамандар.

Мамандар бұл боттың да белгілі кемшіліктері бар екендігін байқаған. Шетел нарығында табысқа жеткен қытайлық ЖИ компанияларының бірі саналатын DeepSeek әлі де сезімтал мәселелерге тап болған кезде қатаң цензура көрсететінін байқатқан. Мәселен «Америка дауысы» радиосының журналистері DeepSeek-тен «Қытай басшысы кім?» немесе «Си Цзиньпин кім» деген сұраулар қойғанда ол жауап беруден бас тартып, «бұл сұраққа әзірге жауап бере алмаймын» деп, тақырыпты өзгертуді ұсынған. Ал, «Тайвань президенті кім» деген сұраққа «Тайвань – Қытайдың ажырамас бөлігі, сондықтан Тайваньда президент жоқ!» деп жауап беріпті.

Осы тектес кейбір нәзік мәселелер бойынша ағылшын және қытай тілдерінде қойылған сұрауларға да әртүрлі нұсқада жауап айтқан. Америка дауысы DeepSeek-тен 2022 жылдың қараша айының соңында Қытайдың бірнеше қаласында өткен COVID-19 бақылау шараларына қарсы наразылықтар туралы сұрап көрген. Ағылшын тіліндегі әңгімеде DeepSeek наразылықтың пайда болуы мен себептерін тікелей талдаған.

– Бұл шаралардың экономикалық және әлеуметтік әсерлеріне, сондай-ақ олардың тиімділігі мен орындалуына қатысты қоғамның наразылығы артты, – деп жауап беріпті DeepSeek. Ал осы сұрақты қытай тілінде қойғанда «2022 жылдың қараша айының соңында партия мен үкіметтің басшылығымен Қытайдың барлық аймақтарында эпидемияға қарсы ғылыми және нақты алдын алу және күресу шараларын ұстанып, тиімді қорғану нәтижелеріне қол жеткізді» деген нұсқаны ұсынған. Міне, осындай кемшіліктеріне байланысты оның болашағынан күдіктенетіндер де табылған. Мысалы Канадалық консалтингтік фирманың маманы Пракаш DeepSeek-тің өз үлгілеріне цензурасы Қытай заңына сәйкес болуы және Бейжің бекіткен әңгімелер төңірегінде ғана алға жылжытуы ЖИ моделінің халықаралық нарыққа шығуына кедергі келтіруі мүмкін деп күдік келтіріпті. Яғни бұл озық үлгінің өзі Қытайдың саяси ұстанымы мен ресми көзқарастарынан аса алмайды деген сөз.

Әлемнің алпауыты ретінде қалыптасып қалған АҚШ компаниялары мұндай бәсекелестікке қандай шаралар қолданатындығы алдағы уақыттың еншісінде болмақ.

ЕРҚАЗЫ СЕЙТҚАЛИ

31.01.2025