Hei kaikki innostuneet!
Tervetuloa 24th edition -tapahtumaan"This Week in AI Engineering"!
Tällä viikolla painopiste on MiniMaxissa, kiinalaisessa tekoäly-yrityksessä, joka on juuri julkaissut raja-arvoisen avoimen perustelun mallin, MiniMax-M1: n, jossa on joitakin putoavia vertailuarvoja. Olemme myös nähneet Googlen esittelevän uuden Flash-Liten variantin, joka on nopeampi ja halvempi. Samaan aikaan Kimi-Dev-72B nousee yhdeksi vahvimmista avoimen lähdekoodin koodausmalleista, jotka kohdistuvat todellisiin debugging-työnkulkuihin, joissa on kahden agentin arkkitehtuuri.
Kuten aina, pakkaamme asiat alla-radar-työkaluilla ja julkaisuilla, jotka ansaitsevat huomionne.
MiniMax-M1 is INSANE
Kiinalainen MiniMaxM1 tukee 1 miljoonan tokenin kontekstin ikkunaa, mikä asettaa sen samaan luokkaan kuin Gemini 2.5 Pro. Mutta tässä on kicker: sen hybridi Mixture-of-Experts-arkkitehtuurin ja salaman huomion mekanismin ansiosta se saavuttaa saman ajattelun laadun kuin DeepSeek R1 vain 25%: lla laskentakustannuksista.
Kiinalainen MiniMax- Variants & BenchmarksMiniMax-M1 on saatavana kahdessa variantissa: M1-40K ja M1-80K, jotka viittaavat niiden tokenituotantokapasiteettiin. Molemmat on rakennettu 456B-parametrin MiniMax-Text-01 säätiöön, jossa on vain 45.9B aktivoitu per token. että MoE-arkkitehtuuri tekee johtopäätöksestä halvempaa ja nopeampaa.
- On AIME 2024, M1-80K scored 86.0% accuracy. It also logged:
- 65.0% on LiveCodeBench
- 56.0% on SWE-bench Verified
- 62.8% on TAU-bench
- 73.4% on OpenAI MRCR (4-needle version)
- Nämä tulokset asettavat sen edelle Qwen3-235B: n ja DeepSeek R1: n pitkän kontekstin ja ohjelmistokäsitteiden tehtävissä.
Training Cost
- Kaikkein järkyttävintä on se, että se on koulutettu vain 534,700 dollarin arvosta, käyttäen 512 NVIDIA H800 -grafiikkaa kolmen viikon ajan. Vertaa sitä DeepSeekin 5,6 miljoonan dollarin tai OpenAI: n sadan miljoonan dollarin putkistoihin, ja ymmärrät, kuinka aggressiivisesti MiniMax optimoi kustannustehokkuuden vaarantamatta suorituskykyä.
Open Access and Developer Features
- MiniMax-M1 sisältää jäsenneltyjen toimintojen soittamisen, online-hakuun perustuvat chatbotit, kuvan / videon tuottamisen ja ääni kloonauksen API:n kautta.
- Tämä on valtava voitto avoimen pääsyn rajamalleille, erityisesti pitkän kontekstin työnkulkuille ja agenttien kehittämiselle.
MiniMax Isn’t Done Yet: Meet Hailuo 02
- Välittömästi M1: n pudottamisen jälkeen he myös julkaisivat Hailuo 02: n, heidän edistyksellisimmän teksti-video- ja kuva-video-mallinsa, ja se kääntää päätään.
- Kuuden sekunnin videot 768p: ssä ja alkuperäinen tuki yksityiskohtaisille kehotuksille, Hailuo tarjoaa fyysisesti johdonmukaisia, visuaalisesti teräviä ja tarinaan perustuvia tuloksia, jotka kilpailevat jopa Googlen Veo 3: n kanssa.
- Mikä todella erottaa sen toisistaan on realistinen liike ja kameran ohjaus. Ajattele tarkkaa painovoimaa, törmäyksiä, nestevaikutuksia. Ja hinnoittelu on myös kilpailukykyinen. $ 0,25 per 6s clip tai $ 0,52 10s, se on halvempaa kuin useimmat suljetut mallit, joilla on tämä uskollisuuden taso.
- MiniMax toimittaa myös API: n Hailuo: n kanssa, mikä helpottaa kehittäjien integrointia.Jos rakennat VFX: tä, elokuvamaista sisältöä tai interaktiivisia tarinan työkaluja, tämä on kokeilun arvoinen.
Gemini 2.5 Flash-Lite: Google’s Cheapest
Google on virallisestiGemini 2.5 Pro and FlashYleisesti saatavilla tuotantokäyttöön. Nämä hybridimallit on jo otettu käyttöön kumppaneiden, kuten Snap, Rooms ja SmartBear. Mutta todellinen kohokohta on uusi Gemini 2.5 Flash-Lite, nyt esikatselussa. Se on nopein ja halvin malli 2.5 -perheessä. Tästä huolimatta se ylittää Gemini 2.0 Flash-Liten koodauksessa, matematiikassa, perusteluissa, tieteessä ja multimodaalisissa vertailuarvoissa.
Gemini 2.5 Pro ja FlashFlash-Lite tukee seuraavia asioita:
- Työkalun käyttö koodin suorittamisen ja Google Searchin kautta
- Multimodaalinen syöttö (teksti, kuvat, ääni)
- 1 miljoonan tokenin kontekstin pituus
- Alhaisen viiveen, suuren läpiviennin tehtävät, kuten luokittelu, käännös ja tiedonlouhinta
- Malli on nyt live Google AI Studiossa, Vertex AI: ssä ja Gemini-sovelluksessa. varhaiset demo-ohjelmat sisältävät PDF-tiedostojen muuntamisen vuorovaikutteisiin paneeleihin ja analyysiraporttien automatisoinnin rakenteettomasta tekstistä.
- Gemini 2.5 Flash-Lite on vahva kilpailija reaaliaikaisille AI-avustajille ja suurille sisäisille työkaluille.
The Best Open Coding Model Yet?
Kimi-Dev-72B esittelyssäjuuri osunut 60.4% SWE-bench Verified, joten se on vahvin avoimen painon koodaus malli juuri nyt. Mikä tekee Kimi-Dev erilainen on sen kaksoisagentti asennus.
Kimi-Dev-72B esittelyssä- BugFixer, joka tunnistaa ja korjaa viallisen koodin
- TestWriter, joka tuottaa yksikötestejä regressioiden vahvistamiseksi ja estämiseksi
- Molemmat agentit noudattavat 2-vaiheista lokalisoinnin ja tarkkojen koodin muokkausten rutiinia. malli on koulutettu yli 150B-tokeneilla reaalimaailman GitHub-ongelmista ja PR: stä, ja sitten hienostunut vahvistusoppimisella ja itsepelimekanismilla monimutkaisten vianmääritystehtävien käsittelemiseksi.
- Se erottuu tulosperusteisesta palkitsemisjärjestelmästään ja opetussuunnitelman tyyliin perustuvasta koulutusputkesta, joka lisää onnistumismääriä suodattamalla heikkoja kehotuksia ja vahvistamalla oikeita ratkaisuja.
- Se on saatavilla GitHubissa ja Hugging Face -palvelussa mallipainoilla, lähdekoodilla ja täydellisellä tekniikkakertomuksella.Jos rakennat automaattisia koodin tarkistuksia, vianmäärityksiä tai kehittäjäagenttityökaluja, tämä on vakava kilpailija.
AI Video Gets Wild: Kling & Midjourney
- Jos luulit, että AI-video ei voisi saada enemmän elokuvia, odota, kunnes näet tämän. Kiinalainen startup KlingAI pudotti Studio Ghibli -tyylisen lyhyen, käsin piirrettyjen tekstuurien, unelmoivien liikkeiden kanssa. He myös jakoivat joitakin ASMR-videoita. ajoitus, rytmi, SFX sopii täydellisesti.
- Samaan aikaan Midjourney avasi juuri V1-videomallinsa ,muuttaen minkä tahansa kuvan tyylilliseksi animaatioksi. Voit hallita liikkeen voimakkuutta, valita "alhaisen" tai "korkean" liikkeen ja jopa säätää vauhtia.
Tools & Releases YOU Should Know About
Yksipuolinen foorumion AI-ensimmäinen verkkosivuston rakentaja, joka on räätälöity indie-suunnittelijoille, startup-yrityksille ja SaaS-perustajille. Se sisältää vetämällä ja pudottamalla malleja, AI-pohjaista copywritingia ja sisäänrakennettua käännöstä, jotka kaikki on optimoitu nopeaan käyttöönottoon. Alusta sisältää myös SSL:n, CDN:n, SEO-työkalut ja integroinnit lomakkeisiin ja uutiskirjeisiin. Ilmainen suunnitelma sisältää yhden live-sivuston, kun taas maksulliset suunnitelmat avaavat tiimin ominaisuudet ja useita projekteja.
Yksipuolinen foorumikoodaaminen'Python Code Generator yksinkertaistaa kehitystä muuttamalla luonnollisen kielen ohjeet tuotantokelpoiseksi koodiksi intuitiivisen käyttöliittymän kautta. Työkalu tukee yli 60 ohjelmointikieltä ja kehystä. Käyttäjät yksinkertaisesti kuvaavat vaatimuksiaan yksinkertaisella englanniksi, ja CodingFleet toimittaa puhtaita, dokumentoituja koodin kappaleita toteutusohjeilla.Se on rakennettu kehittäjille, jotka haluavat nopeita, tarkkoja tuloksia pinoissa.
koodaaminen* jaLentokenttä**Antaa kehittäjille mahdollisuuden sujuvasti vuorovaikutuksessa koodausympäristönsä kanssa käyttämällä kosketus-, ääni- ja räätälöityjä näppäimistön komentoja.AirCodumilla käyttäjät voivat siirtää tiedostoja, kuvia ja koodiosia mobiililaitteidensa ja VS Code -laitteidensa välillä vaivattomasti.
Ja se käsittelee tätä kysymystä »This Week in AI Engineering."
Muista jakaa tämä uutiskirje muiden AI-harrastajien kanssa ja seurata lisää viikoittaisia päivityksiä.