Hei kaikki innostuneet! Tervetuloa 24th edition -tapahtumaan ! "This Week in AI Engineering" Tällä viikolla painopiste on MiniMaxissa, kiinalaisessa tekoäly-yrityksessä, joka on juuri julkaissut raja-arvoisen avoimen perustelun mallin, MiniMax-M1: n, jossa on joitakin putoavia vertailuarvoja. Olemme myös nähneet Googlen esittelevän uuden Flash-Liten variantin, joka on nopeampi ja halvempi. Samaan aikaan Kimi-Dev-72B nousee yhdeksi vahvimmista avoimen lähdekoodin koodausmalleista, jotka kohdistuvat todellisiin debugging-työnkulkuihin, joissa on kahden agentin arkkitehtuuri. Kuten aina, pakkaamme asiat alla-radar-työkaluilla ja julkaisuilla, jotka ansaitsevat huomionne. MiniMax-M1 is INSANE M1 tukee 1 miljoonan tokenin kontekstin ikkunaa, mikä asettaa sen samaan luokkaan kuin Gemini 2.5 Pro. Mutta tässä on kicker: sen hybridi Mixture-of-Experts-arkkitehtuurin ja salaman huomion mekanismin ansiosta se saavuttaa saman ajattelun laadun kuin DeepSeek R1 vain 25%: lla laskentakustannuksista. Kiinalainen MiniMax Kiinalainen MiniMax 
 
 
 
 Variants & BenchmarksMiniMax-M1 on saatavana kahdessa variantissa: M1-40K ja M1-80K, jotka viittaavat niiden tokenituotantokapasiteettiin. Molemmat on rakennettu 456B-parametrin MiniMax-Text-01 säätiöön, jossa on vain 45.9B aktivoitu per token. että MoE-arkkitehtuuri tekee johtopäätöksestä halvempaa ja nopeampaa. On AIME 2024, M1-80K scored   accuracy. It also logged:
 
 86.0% 
 
 
 
 
  on LiveCodeBench 65.0%  on SWE-bench Verified 56.0%  on TAU-bench 62.8%  on OpenAI MRCR (4-needle version) 73.4% Nämä tulokset asettavat sen edelle Qwen3-235B: n ja DeepSeek R1: n pitkän kontekstin ja ohjelmistokäsitteiden tehtävissä. Training Cost 
 
 Kaikkein järkyttävintä on se, että se on koulutettu vain 534,700 dollarin arvosta, käyttäen 512 NVIDIA H800 -grafiikkaa kolmen viikon ajan. Vertaa sitä DeepSeekin 5,6 miljoonan dollarin tai OpenAI: n sadan miljoonan dollarin putkistoihin, ja ymmärrät, kuinka aggressiivisesti MiniMax optimoi kustannustehokkuuden vaarantamatta suorituskykyä. Open Access and Developer Features 
 
 
 MiniMax-M1 sisältää jäsenneltyjen toimintojen soittamisen, online-hakuun perustuvat chatbotit, kuvan / videon tuottamisen ja ääni kloonauksen API:n kautta. Tämä on valtava voitto avoimen pääsyn rajamalleille, erityisesti pitkän kontekstin työnkulkuille ja agenttien kehittämiselle. MiniMax Isn’t Done Yet: Meet Hailuo 02 
 
 
 
 
 Välittömästi M1: n pudottamisen jälkeen he myös julkaisivat Hailuo 02: n, heidän edistyksellisimmän teksti-video- ja kuva-video-mallinsa, ja se kääntää päätään. Kuuden sekunnin videot 768p: ssä ja alkuperäinen tuki yksityiskohtaisille kehotuksille, Hailuo tarjoaa fyysisesti johdonmukaisia, visuaalisesti teräviä ja tarinaan perustuvia tuloksia, jotka kilpailevat jopa Googlen Veo 3: n kanssa. Mikä todella erottaa sen toisistaan on realistinen liike ja kameran ohjaus. Ajattele tarkkaa painovoimaa, törmäyksiä, nestevaikutuksia. Ja hinnoittelu on myös kilpailukykyinen. $ 0,25 per 6s clip tai $ 0,52 10s, se on halvempaa kuin useimmat suljetut mallit, joilla on tämä uskollisuuden taso. MiniMax toimittaa myös API: n Hailuo: n kanssa, mikä helpottaa kehittäjien integrointia.Jos rakennat VFX: tä, elokuvamaista sisältöä tai interaktiivisia tarinan työkaluja, tämä on kokeilun arvoinen. Lohikäärme 02 Gemini 2.5 Flash-Lite: Google’s Cheapest Google on virallisesti Yleisesti saatavilla tuotantokäyttöön. Nämä hybridimallit on jo otettu käyttöön kumppaneiden, kuten Snap, Rooms ja SmartBear. Mutta todellinen kohokohta on uusi Gemini 2.5 Flash-Lite, nyt esikatselussa. Se on nopein ja halvin malli 2.5 -perheessä. Tästä huolimatta se ylittää Gemini 2.0 Flash-Liten koodauksessa, matematiikassa, perusteluissa, tieteessä ja multimodaalisissa vertailuarvoissa. Gemini 2.5 Pro and Flash Gemini 2.5 Pro ja Flash Flash-Lite tukee seuraavia asioita: 
 
 
 
 
 
 
 Työkalun käyttö koodin suorittamisen ja Google Searchin kautta Multimodaalinen syöttö (teksti, kuvat, ääni) 1 miljoonan tokenin kontekstin pituus Alhaisen viiveen, suuren läpiviennin tehtävät, kuten luokittelu, käännös ja tiedonlouhinta Malli on nyt live Google AI Studiossa, Vertex AI: ssä ja Gemini-sovelluksessa. varhaiset demo-ohjelmat sisältävät PDF-tiedostojen muuntamisen vuorovaikutteisiin paneeleihin ja analyysiraporttien automatisoinnin rakenteettomasta tekstistä. Gemini 2.5 Flash-Lite on vahva kilpailija reaaliaikaisille AI-avustajille ja suurille sisäisille työkaluille. The Best Open Coding Model Yet? juuri osunut 60.4% SWE-bench Verified, joten se on vahvin avoimen painon koodaus malli juuri nyt. Mikä tekee Kimi-Dev erilainen on sen kaksoisagentti asennus. Kimi-Dev-72B esittelyssä Kimi-Dev-72B esittelyssä 
 
 
 
 
 
 BugFixer, joka tunnistaa ja korjaa viallisen koodin TestWriter, joka tuottaa yksikötestejä regressioiden vahvistamiseksi ja estämiseksi Molemmat agentit noudattavat 2-vaiheista lokalisoinnin ja tarkkojen koodin muokkausten rutiinia. malli on koulutettu yli 150B-tokeneilla reaalimaailman GitHub-ongelmista ja PR: stä, ja sitten hienostunut vahvistusoppimisella ja itsepelimekanismilla monimutkaisten vianmääritystehtävien käsittelemiseksi. Se erottuu tulosperusteisesta palkitsemisjärjestelmästään ja opetussuunnitelman tyyliin perustuvasta koulutusputkesta, joka lisää onnistumismääriä suodattamalla heikkoja kehotuksia ja vahvistamalla oikeita ratkaisuja. Se on saatavilla GitHubissa ja Hugging Face -palvelussa mallipainoilla, lähdekoodilla ja täydellisellä tekniikkakertomuksella.Jos rakennat automaattisia koodin tarkistuksia, vianmäärityksiä tai kehittäjäagenttityökaluja, tämä on vakava kilpailija. AI Video Gets Wild: Kling & Midjourney 
 
 
 Jos luulit, että AI-video ei voisi saada enemmän elokuvia, odota, kunnes näet tämän. Kiinalainen startup KlingAI pudotti Studio Ghibli -tyylisen lyhyen, käsin piirrettyjen tekstuurien, unelmoivien liikkeiden kanssa. He myös jakoivat joitakin ASMR-videoita. ajoitus, rytmi, SFX sopii täydellisesti. Samaan aikaan Midjourney avasi juuri V1-videomallinsa ,muuttaen minkä tahansa kuvan tyylilliseksi animaatioksi. Voit hallita liikkeen voimakkuutta, valita "alhaisen" tai "korkean" liikkeen ja jopa säätää vauhtia. Studio Ghibli -tyylinen lyhyt V1 videomalli Tools & Releases YOU Should Know About on AI-ensimmäinen verkkosivuston rakentaja, joka on räätälöity indie-suunnittelijoille, startup-yrityksille ja SaaS-perustajille. Se sisältää vetämällä ja pudottamalla malleja, AI-pohjaista copywritingia ja sisäänrakennettua käännöstä, jotka kaikki on optimoitu nopeaan käyttöönottoon. Alusta sisältää myös SSL:n, CDN:n, SEO-työkalut ja integroinnit lomakkeisiin ja uutiskirjeisiin. Ilmainen suunnitelma sisältää yhden live-sivuston, kun taas maksulliset suunnitelmat avaavat tiimin ominaisuudet ja useita projekteja. Yksipuolinen foorumi Yksipuolinen foorumi Python Code Generator yksinkertaistaa kehitystä muuttamalla luonnollisen kielen ohjeet tuotantokelpoiseksi koodiksi intuitiivisen käyttöliittymän kautta. Työkalu tukee yli 60 ohjelmointikieltä ja kehystä. Käyttäjät yksinkertaisesti kuvaavat vaatimuksiaan yksinkertaisella englanniksi, ja CodingFleet toimittaa puhtaita, dokumentoituja koodin kappaleita toteutusohjeilla.Se on rakennettu kehittäjille, jotka haluavat nopeita, tarkkoja tuloksia pinoissa. koodaaminen ' koodaaminen * ja **Antaa kehittäjille mahdollisuuden sujuvasti vuorovaikutuksessa koodausympäristönsä kanssa käyttämällä kosketus-, ääni- ja räätälöityjä näppäimistön komentoja.AirCodumilla käyttäjät voivat siirtää tiedostoja, kuvia ja koodiosia mobiililaitteidensa ja VS Code -laitteidensa välillä vaivattomasti. Lentokenttä Ja se käsittelee tätä kysymystä » " This Week in AI Engineering. Muista jakaa tämä uutiskirje muiden AI-harrastajien kanssa ja seurata lisää viikoittaisia päivityksiä.

Read My Stories

Tämä ääni on tuotettu tarinan alkuperäisellä kielellä!

Kiinalainen AI-malli lupaa Gemini 2.5 Pro-tason suorituskyvyn neljänneksellä kustannuksista

About Author

KOMMENTIT

RIPUTA TAGSIA

TÄMÄ ARTIKKELI ESITETTIIN

Related Stories

Hurry! Just One Month Left to Win Up to $2,000 in the #blockchain Writing Contest

Win Up to $2000 in the #blockchain Writing Contest by Aleph Cloud and HackerNoon

The Spacecoin Writing Contest by Spacecoin and HackerNoon: Final Round Results 🎉

About Bitcoin And “Web 2.5,” HackerNoon’s First Documentary

Hurry! Just One Month Left to Win Up to $2,000 in the #blockchain Writing Contest

Win Up to $2000 in the #blockchain Writing Contest by Aleph Cloud and HackerNoon

The Spacecoin Writing Contest by Spacecoin and HackerNoon: Final Round Results 🎉

About Bitcoin And “Web 2.5,” HackerNoon’s First Documentary

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps