Għal BMS, xarabank, industrijali, kejbil ta 'strumentazzjoni.

Elon Musk u t-tim Xai nedew uffiċjalment l-aħħar verżjoni ta 'Grok, GroK3, waqt livestream. Qabel dan l-avveniment, ammont sinifikanti ta 'informazzjoni relatata, flimkien mal-hype promozzjonali ta' Musk 24/7, qajmu aspettattivi globali għal GROK3 għal livelli bla preċedent. Ġimgħa biss ilu, Musk iddikjara b'fiduċja waqt livestream waqt li kkummenta fuq Deepseek R1, "Xai wasal biex iniedi mudell AI aħjar." Mid-dejta ppreżentata diretta, GROK3 kien qabeż il-mudelli mainstream attwali kollha fil-punti ta 'riferiment għall-matematika, ix-xjenza, u l-ipprogrammar, bil-Musk saħansitra jiddikjara li GROK3 se jintuża għal kompiti tal-komputazzjoni relatati mal-missjonijiet ta' SpaceX Mars, li jbassru "innovazzjonijiet fil-livell tal-Premju Nobel fi żmien tliet snin." Madankollu, dawn bħalissa huma biss l-affermazzjonijiet ta 'Musk. Wara t-tnedija, ittestajt l-aħħar verżjoni beta ta 'GROK3 u għamilt il-mistoqsija klassika għal mudelli kbar: "Liema hija akbar, 9.11 jew 9.9?" B’dispjaċir, mingħajr l-ebda kwalifikaturi jew marki, l-hekk imsejħa Smartest GroK3 xorta ma setgħetx twieġeb din il-mistoqsija b’mod korrett. GroK3 naqas milli jidentifika b'mod preċiż it-tifsira tal-mistoqsija.
Dan it-test malajr ġibed attenzjoni konsiderevoli minn bosta ħbieb, u inzerta, diversi testijiet simili barranin urew GroK3 li qed jitħabtu ma 'mistoqsijiet bażiċi tal-fiżika / matematika bħal "Liema ballun jaqa' l-ewwel mit-torri li jegħleb ta 'Pisa?" Għalhekk, ġie ttikkettjat b'mod umoristiku bħala "ġenju li ma jridx iwieġeb mistoqsijiet sempliċi."

GroK3 huwa tajjeb, imma mhux aħjar minn R1 jew O1-Pro.
GroK3 esperjenza "fallimenti" fuq ħafna testijiet ta 'għarfien komuni fil-prattika. Matul l-avveniment tat-tnedija XAI, Musk wera bl-użu ta 'GROK3 biex janalizza l-klassijiet u l-effetti tal-karattri mill-passaġġ tal-logħob ta' l-Eżilju 2, li huwa ddikjara li jilgħab ta 'spiss, iżda ħafna mit-tweġibiet ipprovduti minn GroK3 ma kinux korretti. Musk matul il-livestream ma ndunax din il-kwistjoni ovvja.
Dan l-iżball mhux biss ipprovda aktar evidenza għal netizens barranin biex iqajjem lil Musk għal "sejba ta 'sostitut" fil-logħob iżda wkoll qajjem tħassib sinifikanti rigward l-affidabbiltà ta' GroK3 f'applikazzjonijiet prattiċi. Għal tali "ġenju," irrispettivament mill-kapaċitajiet attwali tiegħu, l-affidabbiltà tagħha f'xenarji ta 'applikazzjoni estremament kumplessi, bħal kompiti ta' esplorazzjoni ta 'Mars, tibqa' fid-dubju.
Bħalissa, bosta testers li rċivew aċċess għal GroK3 ġimgħat ilu, u dawk li għadhom kemm ittestjaw il-kapaċitajiet tal-mudell għal ftit sigħat ilbieraħ, kollha jindikaw konklużjoni komuni: "GroK3 huwa tajjeb, iżda mhuwiex aħjar minn R1 jew O1-Pro."

Perspettiva kritika dwar "tfixkil nvidia"
Fil-PPT ippreżentat uffiċjalment waqt ir-rilaxx, GROK3 intwera li kien "ferm 'il quddiem" fl-arena ta' chatbot, iżda dan it-tekniki grafiċi użati b'mod għaqli: l-assi vertikali fuq il-leaderboard elenka biss ir-riżultati fil-firxa ta 'punteġġ 1400-1300, u għamel id-differenza oriġinali ta' 1% fir-riżultati tat-test tidher eċċezzjonalment sinifikanti f'din il-preżentazzjoni.

Fir-riżultati attwali tal-punteġġ tal-mudell, GROK3 huwa biss 1-2% quddiem Deepseek R1 u GPT-4.0, li jikkorrispondi għall-esperjenzi ta 'ħafna utenti fit-testijiet prattiċi li sabu "l-ebda differenza notevoli." GroK3 jaqbeż is-suċċessuri tiegħu b'1% -2%.

Għalkemm GroK3 skorja ogħla mill-mudelli kollha ttestjati pubblikament bħalissa, ħafna ma jiħdux dan bis-serjetà: wara kollox, Xai qabel ġie kkritikat għal "manipulazzjoni ta 'punteġġ" fl-era GroK2. Hekk kif il-leaderboard jippenalizza l-istil tat-tul tat-tweġiba, il-punteġġi naqsu bil-kbir, l-industrija ewlenin ta 'ġewwa ħafna drabi jikkritikaw il-fenomenu ta' "punteġġ għoli iżda kapaċità baxxa."
Sew jekk permezz ta '"manipulazzjoni" tal-leaderboard jew tricks tad-disinn fl-illustrazzjonijiet, huma jiżvelaw l-ossessjoni ta' Xai u Musk bil-kunċett ta '"tmexxija tal-pakkett" fil-kapaċitajiet tal-mudell. Musk ħallas prezz qawwi għal dawn il-marġini: matul it-tnedija, huwa ftaħar li uża 200,000 GPUs H100 (fejn talab "aktar minn 100,000" matul il-livestream) u li kiseb ħin ta 'taħriġ totali ta' 200 miljun siegħa. Dan wassal lil uħud biex jemmnu li jirrappreżenta barka sinifikanti oħra għall-industrija tal-GPU u biex tikkunsidra l-impatt ta 'Deepseek fuq is-settur bħala "bluha." Notevolment, xi wħud jemmnu li l-poter komputazzjonali pura se jkun il-futur tat-taħriġ tal-mudell.
Madankollu, xi netizens qabblu l-konsum ta '2000 GPUs H800 fuq xahrejn biex jipproduċu Deepseek V3, il-kalkolu tal-konsum attwali ta' taħriġ ta 'taħriġ ta' GroK3 huwa 263 darba dak ta 'V3. Id-distakk bejn Deepseek V3, li skorja 1402 punt, u GroK3 huwa ftit inqas minn 100 punt. Wara r-rilaxx ta 'din id-dejta, ħafna malajr indunaw li wara t-titlu ta' GroK3 bħala "l-iktar b'saħħtu tad-dinja" tinsab effett ta 'utilità marġinali ċar - il-loġika ta' mudelli ikbar li jiġġeneraw prestazzjoni aktar b'saħħitha bdiet turi qligħ li qed jonqos.

Anke b '"punteġġ għoli iżda b'kapaċità baxxa," GroK2 kellu ammonti kbar ta' dejta ta 'l-ewwel parti ta' kwalità għolja mill-pjattaforma X (Twitter) biex tappoġġja l-użu. Madankollu, fit-taħriġ ta 'GROK3, Xai naturalment iltaqa' ma '"limitu" li l-OpenAI bħalissa qed jiffaċċja - in-nuqqas ta' dejta ta 'taħriġ premium jesponi malajr l-utilità marġinali tal-kapaċitajiet tal-mudell.
L-iżviluppaturi ta 'GroK3 u Musk x'aktarx l-ewwel li jifhmu u jidentifikaw dawn il-fatti fil-fond, u huwa għalhekk li Musk semma kontinwament fuq il-midja soċjali li l-utenti tal-verżjoni li qed jesperjenzaw issa huwa "għadu biss il-beta" u li "l-verżjoni sħiħa se tiġi rilaxxata fix-xhur li ġejjin." Musk ħa r-rwol tal-maniġer tal-prodott ta 'GroK3, li jissuġġerixxi li l-utenti jipprovdu feedback dwar diversi kwistjonijiet li jiltaqgħu magħhom fit-taqsima tal-kummenti.
Madankollu, fi żmien ġurnata, il-prestazzjoni ta 'GroK3 bla dubju qajmet allarmi għal dawk li jittamaw li jiddependu fuq "muskolu komputazzjonali massiv" biex iħarrġu mudelli kbar aktar b'saħħithom: ibbażati fuq informazzjoni dwar il-Microsoft disponibbli pubblikament, GPT-4 ta' OpenAI għandu daqs ta 'parametru ta' 1.8 triljun parametri, aktar minn għaxar darbiet dak ta 'GPT-3. Xnigħat jissuġġerixxu li d-daqs tal-parametru ta 'GPT-4.5 jista' jkun saħansitra akbar.
Hekk kif id-daqsijiet tal-parametri tal-mudell jiżdiedu, l-ispejjeż tat-taħriġ huma wkoll qed jiżdiedu. Bil-preżenza ta 'GroK3, kontendenti bħal GPT-4.5 u oħrajn li jixtiequ jkomplu "jaħarqu l-flus" biex jiksbu prestazzjoni mudell aħjar permezz tad-daqs tal-parametru għandhom jikkunsidraw il-limitu li issa huwa ċar fil-vista u jikkontempla kif jista' jegħlebha. F'dan il-mument, Ilya Sutskever, ex-xjentista kap ta 'OpenAI, kienet iddikjarat qabel f'Diċembru li għadda, "It-taħriġ ta' qabel li ninsabu familjari se jintemmu," li reġgħet reġgħet ingħatat f'diskussjonijiet, li wasslet l-isforzi biex issib it-triq vera għat-taħriġ ta 'mudelli kbar.

Il-perspettiva ta 'Ilya tinstema l-allarm fl-industrija. Huwa ppreveda b'mod preċiż l-eżawriment imminenti ta 'dejta ġdida aċċessibbli, li twassal għal sitwazzjoni fejn il-prestazzjoni ma tistax tkompli tissaħħaħ permezz tal-akkwist tad-dejta, li tqabbelha mal-eżawriment tal-fjuwils fossili. Huwa indika li "bħaż-żejt, il-kontenut iġġenerat mill-bniedem fuq l-internet huwa riżorsa limitata." Fil-previżjonijiet ta 'Sutskever, il-ġenerazzjoni li jmiss ta' mudelli, wara t-taħriġ, se jkollha "awtonomija vera" u kapaċitajiet ta 'raġunament "simili għall-moħħ tal-bniedem."
B'differenza mill-mudelli mħarrġa minn qabel tal-lum li jiddependu primarjament fuq it-tqabbil tal-kontenut (ibbażat fuq il-kontenut tal-mudell mitgħallem qabel), is-sistemi futuri tal-AI se jkunu jistgħu jitgħallmu u jistabbilixxu metodoloġiji biex isolvu problemi b'mod simili għall- "ħsieb" tal-moħħ tal-bniedem. Bniedem jista 'jikseb kompetenza fundamentali f'suġġett bi letteratura professjonali bażika biss, filwaqt li mudell kbir AI jirrikjedi miljuni ta' punti ta 'dejta biex jiksbu biss l-iktar effikaċja bażika ta' livell ta 'dħul. Anke meta l-kliem jinbidel xi ftit, dawn il-mistoqsijiet fundamentali jistgħu ma jinftiehmux b'mod korrett, li juru li l-mudell ma tjiebx ġenwinament fl-intelliġenza: il-mistoqsijiet bażiċi iżda li ma jinħallux imsemmija fil-bidu tal-artikolu jirrappreżentaw eżempju ċar ta 'dan il-fenomenu.

Konklużjoni
Madankollu, lil hinn mill-forza brutali, jekk GroK3 tabilħaqq jirnexxi fl-industrija li "l-mudelli mħarrġa minn qabel qed joqorbu lejn it-tmiem tagħhom," iġorru implikazzjonijiet sinifikanti għall-qasam.
Forsi wara li l-frenzy li jdawwar GroK3 jonqos gradwalment, aħna nassistu aktar każijiet bħall-eżempju ta 'Fei-Fei Li ta' "irfinar ta 'mudelli ta' prestazzjoni għolja fuq sett ta 'data speċifiku għal biss $ 50," fl-aħħar niskopru t-triq vera lejn AGI.
Kejbils tal-kontroll
Sistema ta 'kejbil strutturata
Netwerk u dejta, kejbil tal-fibra ottika, korda tal-garża, moduli, wiċċ
16 ta 'April-18th, 2024 Enerġija tal-Lvant Nofsani f'Dubai
April 16-18th, 2024 Securika f'Moska
Mejju.
22 ta 'Ottubru-25, 2024 Ċina tas-Sigurtà f'Beijing
Nov.19-20, 2024 World Connected KSA
Ħin ta 'wara: Frar-19-2025