- „Gemini“ įrankių rinkinyje derinami stabilūs įrankiai, tokie kaip „Canvas“, „Deep Research“ ir „Guided Learning“, su eksperimentinėmis „Labs“ funkcijomis.
- „Gemini“ API atveria daugiamodalinius ir funkcijas iškviečiančius darbo eigų sprendimus „Google Workspace“ sistemoje ir pritaikytose automatizacijose.
- Vadovaujamas mokymasis, „Canvas“ ir agentai paverčia „Gemini“ ir asmeniniu mokytoju, ir darbo asistentu, skirtu dokumentams, skaidrėms ir el. laiškams tvarkyti.
- Naudodamos „Labs“, „Gemini Enterprise“ ir „Workspace“ integraciją, komandos gali saugiai testuoti galingą dirbtinį intelektą, remdamosi savo duomenimis.
„Dvynių įrankių rinkinys“ nebėra tik skambi frazė; tai praktiškas programėlių, įrankių, agentų ir API rinkinys, kurį „Google“ tyliai įpina į viską – nuo kasdienio mokymosi iki įmonių darbo eigų. Vietoj vieno monolitinio asistento „Gemini“ dabar elgiasi labiau kaip įrankių dėžė, kurioje kiekviena funkcija yra konkretus instrumentas: tyrimų variklis, mokytojas, kodo pagalbininkas, susitikimų planuoklė, skaidrių kūrimo priemonė ir daug daugiau.
Jei suprantate, kaip šie elementai dera tarpusavyje – „Canvas“, valdomas mokymasis, laboratorijos, agentai, „Gemini Enterprise“ ir „Gemini“ API – galite paversti „Gemini“ tikru darbiniu arkliuku, o ne tik nauju pokalbių robotu. Žemiau rasite išsamią šio įrankių rinkinio apžvalgą: kas yra stabilioje „Įrankių“ srityje, kas testuojama „Laboratorijose“, kaip „Gemini“ veikia kaip mokytojas su vaizdais ir vaizdo įrašais ir kaip kūrėjai gali prijungti API prie „Google Workspace“, kad galėtų atlikti rimtą automatizavimą.
Kas tiksliai šiandien yra Dvynių įrankių rinkinyje?
Gemini geriausiai suprantamas kaip dirbtinio intelekto modelių šeima (Kas yra kalbos modeliai?) („Gemini 1.0“, „Gemini 1.5“, „Gemini 3“ ir t. t.) teikiamos per skirtingas sąsajas: žiniatinklį, mobiliąsias programėles, „Workspace“ integraciją ir kūrėjo API. „Įrankių rinkinio“ idėja kyla iš to, kaip „Google“ dabar grupuoja konkrečias galimybes „Gemini“ sąsajoje, ypač internete.
Žiniatinklyje pagrindinis „Gemini“ rinkiklis yra padalintas į dvi pagrindines zonas: „Įrankiai“ – stabiliam, gamybai paruoštam funkcionalumui ir „Laboratorijos“ – vis dar vykstantiems eksperimentams. Įsivaizduokite „Įrankius“ kaip patikimą atsuktuvą, kurį griebiate kiekvieną dieną, o „Laboratorijas“ – tai dėklą, kuriame laikote prototipus, kurie kitą savaitę gali pakeisti formą.
Mobiliuosiuose įrenginiuose „Gemini“ programėlėse pridedama daug tų pačių įrankių – vedamas mokymasis, „Canvas“ tipo patirtis, pagalba su paveikslėliais – tačiau jie diegiami palaipsniui. Jei programėlėje dar nematote konkrečios funkcijos, „Google“ aiškiai rekomenduoja bandyti dar kartą vėliau arba pereiti prie gemini.google.com norėdami pamatyti naujausią versiją žiniatinklyje.
Po gaubtu visus šiuos paviršius palaiko „Gemini“ API, kuri atveria multimodalinius modelius ir funkcijų iškvietimą, kad galėtumėte generuoti turinį, analizuoti vaizdus arba organizuoti darbo eigas naudodami kodą. Ši API yra daugelio „Workspace“ automatizavimų, kuriuos aptarsime vėliau, pagrindas.
Įrankiai ir laboratorijos: kaip „Gemini“ tvarko savo funkcijas
Kadangi „Gemini“ sukaupė daugiau mygtukų ir režimų, „Google“ aiškiau atskyrė brandžias ir eksperimentines funkcijas per du skyrius: „Įrankiai“ ir „Laboratorijos“. Šis pakeitimas jau matomas žiniatinklio sąsajoje ir yra palaipsniui diegiamas iš „Google“ serverių, todėl ne visos paskyros tuo pačiu metu mato tą patį išdėstymą.
„Įrankių“ skiltyje „Google“ pateikiamos funkcijos, kurias laiko stabiliomis ir nuspėjamomis kasdieniam naudojimui. Tokių šaltinių kaip „Android Police“ ir „9to5Google“ ataskaitos rodo, kad ši sritis apima tokius elementus kaip „Deep Research“, vaizdų generavimas, vaizdo įrašų kūrimas naudojant „Veo“, „Canvas“, vadovaujamą mokymąsi ir „Deep Think“, kartais susietus su konkrečiais prenumeratos lygiais, tokiais kaip „Google AI Pro“ arba „Google AI Ultra“.
Kita vertus, „Laboratorijos“ yra tiesioginė žaidimų aikštelė: speciali sritis „Gemini“ rinkiklyje, kurioje grupuojamos funkcijos, pažymėtos kaip eksperimentinės. Paprastai matysite piktogramas su maža laboratorine kolba ir etiketėmis, tokiomis kaip „Gemini Agent“, „Dinaminis rodinys“ (dar vadinamas vizualiniu išdėstymu) ir „Asmeninis intelektas“. Spustelėjus bet ką skiltyje „Laboratorijos“, lūkestis paprastas: elgesys gali pasikeisti, išnykti arba judėti be jokio įspėjimo.
Produkto dizaino požiūriu šis atskyrimas yra svarbus pasitikėjimui. Kai dirbtinio intelekto programėlė sparčiai auga, rizika kyla ne tik dėl „per didelio funkcijų skaičiaus“, bet ir dėl „nežinojimo, kuriomis funkcijomis galiu pasikliauti“. Kasdienius įrankius skirstydami į vieną zoną, o eksperimentus – į kitą, „Gemini“ signalizuoja apie riziką panašiai kaip automobilyje skiria „įprastą“ ir „sportinį“ režimus.
Stabilūs „Gemini“ įrankiai: giluminiai tyrimai, „Canvas“, valdomas mokymasis ir kita
Pagrindinė „Gemini“ įrankių dėžutė daugumai vartotojų yra skiltyje „Įrankiai“, kur rasite patirtis, kuriomis remdamiesi „Google“ nori, kad susikurtumėte įpročius. Nors tiksli sudėtis priklauso nuo paskyros ir prenumeratos lygio, keli elementai jau yra svarbūs.
„Deep Research“ paverčia „Gemini“ struktūrizuotu tyrimų asistentu, o ne bendriniu pokalbių modeliu. Kai užduodate klausimą, kuriam išspręsti reikia ieškoti kelių šaltinių, „Deep Research“ taiko aiškesnį, kelių pakopų procesą, pateikdama nuoseklią metodiką, kad vartotojai žinotų, ko tikėtis kiekvieną kartą, kai ją iškviečia.
Įrankių stalčiuje taip pat yra turinio kūrimo įrankiai vaizdams ir vaizdo įrašams, įskaitant „Veo“ teikiamas integracijas. Vartotojams, kurie vizualiniam turiniui naudoja „Gemini“, reikia, kad šios funkcijos būtų randamos ir pakankamai stabilios, o ne paslėptos už besikeičiančių eksperimentinių vėliavėlių.
„Canvas“ yra dar vienas ramstis: darbo srities režimas, kuriame galite pradėti dokumentą ar kodavimo projektą tiesiai iš raginimo, o tada iteratyviai jį tobulinti naudodami „Gemini“. Užklausų juostoje galite pasirinkti „Drobė“ ir įvesti raginimą, kad sugeneruotumėte turinio ar kodo pradžios tašką, o tada tęsti redagavimą interaktyviame, greta esančiame makete.
Vadovaujamas mokymasis ir gilus mąstymas užbaigia labiau į kognityvinius gebėjimus orientuotus įrankius, ypač tiems vartotojams, kurie nori struktūrizuotos pagalbos sudėtingomis temomis. Vadovaujamas mokymasis gali elgtis kaip korepetitorius, žingsnis po žingsnio vedantis jus per idėjas, o „Deep Think“ skatina lėtesnį, apgalvotesnį mąstymą apie sudėtingus klausimus.
Dvyniai kaip asmeninis mokytojas: vedamas mokymasis, vaizdai ir vaizdo įrašai
Vienas patogiausių „Gemini“ įrankių rinkinio aspektų yra jo gebėjimas veikti kaip privataus mokytojo, derinant vedamas sekas su vaizdiniais paaiškinimais. Užuot pildę teksto sieną, „Gemini“ gali į savo atsakymus įtraukti paveikslėlių, eskizų ir net vaizdo įrašų, kad sąvokos būtų lengviau suprantamos.
Praktiškai galite paprašyti Dvynių paaiškinti temą ir aiškiai paprašyti diagramos, vaizdinio suskirstymo ar iliustracinio paveikslėlio. Atsakyme šie vaizdai gali būti tiesiogiai įterpti į paaiškinimą, taip padedant vizualizuoti, tarkime, matematinę sąvoką, darbo eigą ar mokslinį procesą.
Taip pat palaikomas vaizdo įrašais pagrįstas mokymasis, nors detalės skiriasi priklausomai nuo regiono ir diegimo etapo. Kai kurioms temoms „Gemini“ gali pateikti arba nurodyti vaizdo įrašus, kurie papildo tekstinį atsakymą, taip sukurdami multimodalinį mokymosi kelią, kuriame jūs skaitote, žiūrite ir sąveikaujate su klausimais vienu metu.
Šis mokymo režimas mobiliosiose „Gemini“ programėlėse diegiamas palaipsniui, todėl galite iš karto nematyti visų parinkčių. Kai taip nutinka, atsarginis variantas yra naudoti žiniatinklio patirtį, kur „Gemini“ funkcijų rinkinys dažnai pasirodo anksčiau, atliekant etapinius diegimus.
„Gemini Enterprise“ ir „Workspace“: dirbtinio intelekto agentai komandoms
Be asmeninio naudojimo, „Gemini“ įrankių rinkinys apima ir darbo vietą per „Gemini Enterprise“ ir „Google Workspace“ integracijas. Čia dėmesys perkeliamas nuo vienkartinių raginimų prie nuolatinių agentų, darbo eigų ir bendradarbiavimo dideliu mastu.
„Google“ apibūdina „Gemini Enterprise“ kaip pažangią agentų platformą, kuri kiekvienam darbuotojui ir darbo eigai suteikia geriausias „Google“ dirbtinio intelekto savybes. Praktiškai tai leidžia komandoms atrasti, kurti, bendrinti ir paleisti dirbtinio intelekto agentus saugioje aplinkoje, paremtoje jų pačių įmonės duomenimis, taip sumažinant kūrimo kliūtis ir suteikiant galimybę naudoti tokius atvejus kaip pardavimų analizė, procesų automatizavimas ir vidinė žinių paieška.
Pati „Google Workspace“ veikia kaip bendradarbiavimo platforma, sustiprinta „Gemini“, o dirbtinis intelektas integruotas į tokias programas kaip „Gmail“, „Docs“ ir „Meet“. Užuot naudoję atskirą dirbtinio intelekto įrankį, vartotojai gali iškviesti „Gemini“ savo kasdienėse produktyvumo programose, kad galėtų kurti turinio juodraščius, apibendrinti informaciją arba generuoti idėjas kontekste.
Kai kuriuose nustatymuose galite netgi tiesiogiai bendrauti su „Gemini“ per savo įmonės duomenis, saugomus „Google Workspace“, „Microsoft 365“ ir kitose prijungtose sistemose. Tai paverčia „Gemini“ įmonės žinių sluoksniu, galinčiu atsakyti į klausimus, pagrįstus el. laiškais, dokumentais ir failais, atsižvelgiant į IT sukonfigūruotus leidimus ir saugos nustatymus.
„Gemini“ API: kūrėjo įrankių rinkinio pagrindas
Po vartotojams skirtomis „Gemini“ programėlėmis slypi „Gemini“ API, kuri kūrėjams suteikia tuos pačius pagrindinius modelius, kuriuos jie gali įterpti į savo programas. Šioje API sąsajoje susijungia daugiamodalumas, funkcijų iškvietimas ir tinkinti darbo eigos, kad būtų galima atlikti rimtą automatizavimą, ypač naudojant „Google Workspace“ ir „Apps Script“.
„Gemini“ modeliai yra galingiausios „Google“ dirbtinio intelekto sistemos, o API teikia įvairius modelių variantus – pavyzdžiui, į tekstą orientuotas ir į regėjimą orientuotas versijas – kiekvienas su specifinėmis galimybėmis ir apribojimais. Galite juos vizualiai tyrinėti „Google AI Studio“ – talpinamoje sąsajoje, skirtoje išbandyti raginimus, koreguoti modelio nustatymus ir netgi derinti pasirinktinius modelius nerašant kodo.
Norėdami pradėti naudoti API, turite pateikti API rakto užklausą per „Google AI Studio“ arba kitą palaikomą konsolę ir išbandyti jį paprastu REST iškvietimu. Pavyzdžiui, galite eksportuoti savo raktą į aplinkos kintamąjį, pvz., GOOGLE_API_KEY, ir iškviesti galinį tašką, kuriame pateikiami galimi modeliai, gaunant JSON, pvz. modeliai/gemini-1.0-pro jei viskas sukonfigūruota teisingai.
Toliau turinio generavimas yra JSON naudingosios apkrovos siuntimas atitinkamam galiniam taškui, pvz., generuoti turinį pasirinkto modelio metodas. Minimalus prašymas apima turinys laukas su teksto dalimis, o nebūtinas kartos konfigūracija bei saugos nustatymai leidžia valdyti tokius parametrus kaip temperatūra ir saugos filtrai.
Gemini API iškvietimas iš programų scenarijaus
Vienas galingiausių „Gemini“ įrankių rinkinio modelių yra API derinimas su „Google Apps Script“, siekiant automatizuoti darbo eigas „Workspace“ viduje. Šis metodas leidžia naudoti „Gemini“ kartu su tokiomis paslaugomis kaip „Drive“, „Calendar“, „Gmail“, „Sheets“ ir „Slides“, nekuriant visos serverio sistemos.
Standartinė sąranka prasideda nuo „Apps Script“ projekto (pavyzdžiui, sukurto naudojant script.new), kuriame „Gemini“ API raktą saugote kaip scenarijaus ypatybę. Kode jūs gaunate tą reikšmę ir sukuriate konkretaus modelio galinio taško URL, dažnai gemini-1.0-pro-latest:generuoti turinį su jūsų API raktu, pateiktu kaip užklausos parametru.
Pagalbinė funkcija, pvz. callGemini(klausa, temperatūra) paprastai sukuria JSON naudingąją apkrovą, siunčia ją per UrlFetchApp.fetch ir analizuoja atsakymą, kad išgautų sugeneruotą tekstą. Šis apvalkalas supaprastina pakartotinį API naudojimą iš skirtingų jūsų scenarijaus paslaugų.
Testavimas yra paprastas: galite sukurti testGemini() funkcija, kuri apibrėžia raginimą, iškviečia jūsų pagalbininką ir registruoja įvestį ir išvestį vykdymo žurnaluose. Kai tai veiks, žinosite, kad jūsų „Apps Script“ aplinka ir „Gemini“ API raktas yra tinkamai sukonfigūruoti sudėtingesniems scenarijams.
„Gemini Vision“ galinio taško naudojimas vaizdams
„Gemini“ įrankių rinkinys apima daugiau nei tekstą dėl multimodalinio palaikymo, ypač galimybės apdoroti vaizdus per regėjimu pagrįstą galinį įrenginį. „Apps Script“ tai paprastai yra atskiras galinis taškas, pvz. gemini-1.0-pro-vision-latest:generateContent, vėlgi parametruojamas jūsų API raktu.
Tipiškas pagalbininkas, pvz. callGeminiProVision(klausa, vaizdas, temperatūra) konvertuos vaizdo bloką į „base64“, įdės jį kaip įterptieji duomenys su atitinkamu MIME tipu ir išsiųskite jį kartu su tekstiniu raginimu. Tada modelis grąžina tekstą, kuris atspindi jo supratimą apie vaizdą ir raginimą.
Norėdami patikrinti sąranką, galite parašyti nedidelį testGeminiVision() kuris atsisiunčia pavyzdinį vaizdą iš viešojo URL, perduoda jį jūsų pagalbininkui ir užregistruoja įdomų faktą arba „Gemini Vision“ sukurtą analizę. Toks testas parodo, kad daugiamodalinė įvestis jūsų aplinkoje veikia tinkamai.
Kai regėjimo srautas taps stabilus, galėsite jį pakartotinai panaudoti aukštesnio lygio automatizavimuose, pvz., analizuodami diagramas iš „Google“ skaičiuoklių arba vaizdus, saugomus diske. Štai čia multimodalumas pradeda atrodyti kaip išties naudinga įrankių rinkinio dalis, o ne demonstracinis triukas.
Funkcijos iškvietimas: prieigos prie įrankių suteikimas Gemini
Kitas svarbus „Gemini“ įrankių rinkinio elementas yra funkcijų iškvietimas, kuris leidžia modeliui nuspręsti, kada iškviesti jūsų pačių įrankius ar API. Užuot tiesiog generavę tekstą, „Gemini“ gali grąžinti struktūrizuotą informaciją funkcijos iškvietimas objektai, apibūdinantys, kurią funkciją naudoti ir su kokiais argumentais.
„Apps Script“ galite nustatyti pagalbininką, pvz. callGeminiWithTools(klausa, įrankiai, temperatūra) kuris siunčia įrankiai specifikaciją kartu su vartotojo raginimu. Ši specifikacija atitinka Funkcijos deklaracija schema, kurioje aprašomas funkcijos pavadinimas, paskirtis ir JSON parametrai.
Kai „Gemini“ nusprendžia, kad reikia naudoti įrankį, jo atsakyme yra funkcijos iškvietimo objektas, kurį galite išanalizuoti savo scenarijuje ir nukreipti į faktinį įgyvendinimą. Pavyzdžiui, galite apibrėžti įrankį pavadinimu „datetime“, kuris grąžina dabartinę datą ir laiką, ir stebėti, kaip „Gemini“ prašo šios funkcijos išspręsti su kalendoriaus skaičiavimais susijusius klausimus.
Funkcijų iškvietimas yra ypač galingas, nes gali veikti keliuose etapuose, o ne tik vienkartinėse užklausose. Tai reiškia, kad galite kurti sudėtingesnius, pokalbių agentus, kurie nusprendžia, kada iškviesti įrankius, interpretuoja rezultatus ir tęsia dialogą.
Demonstracinės integracijos: „Gemini“ + „Google Workspace“ kaip praktiškas įrankių rinkinys
Sujungus teksto generavimą, vizualinę įvestį ir funkcijų iškvietimą, „Gemini“ įrankių rinkinys tampa praktišku darbo srities automatizavimo varikliu. „Google“ kodo laboratorijos medžiagoje pateikiama keletas konkrečių pavyzdžių, iliustruojančių, kas įmanoma.
Aukštu lygiu gaunamos vartotojų užklausos perduodamos „Gemini“ su turimų įrankių rinkiniu, atspindinčiu skirtingus darbo eigą: susitikimų planavimą, el. laiškų rengimą iš diagramų ir skaidrių kūrimą. Remdamasi užklausa, „Gemini“ pasirenka tinkamą funkciją ir grąžina funkcijos iškvietimą su struktūrizuotais argumentais, tokiais kaip laikas, failų pavadinimai arba temos.
„Apps Script“ scenarijuje funkcijos iškvietimą interpretuojate viduje jei… kitaip grandinę, iškviečiant atitinkamą darbo eigą, pavyzdžiui, setupMeeting(), El. pašto juodraštis() or sukurtiDeck(). Šis modelio samprotavimo ir aiškios scenarijaus logikos derinys paverčia „Gemini“ iš pokalbių lango į įrankių dėžę realiam darbui.
Susitikimų automatizavimas: Disko failų apibendrinimas į Kalendoriaus įvykius
Vienoje demonstracinėje versijoje parodyta, kaip „Gemini“ gali padėti nustatyti kalendoriaus susitikimą, į kurį automatiškai įtraukiama „Google“ diske esančio teksto failo santrauka. Vartotojas gali įvesti kažką panašaus į: „Suplanuokite susitikimą rytoj 10 val. ryto su Helen, kad aptartume naujienas iš failo „Gemini-blog.txt“.“
Užkulisiuose įrankių specifikacijoje deklaruojamas darbo srities įrankis pavadinimu „setupMeeting“ su laiko, gavėjo ir failo pavadinimo parametrais. Kai „Gemini“ interpretuoja užklausą, ji pasirenka šį įrankį ir grąžina funkcijos iškvietimą su užpildytais argumentais.
Atitinkamas setupMeeting() funkcija tada suranda nurodytą failą diske, nuskaito jo turinį ir perduoda jį „Gemini“ per skambinkDvyniams() su instrukcijomis, kaip sukurti trumpą JSON objektą su pavadinimu ir trumpa santrauka. Atsakymas gali būti pateiktas formatavimo barjerais, kuriuos pašalinate prieš analizuodami kaip JSON.
Naudodamas išgautą pavadinimą ir santrauką, scenarijus sukuria kalendoriaus įvykį naudodamas Kalendoriaus programa, nustato santraukos aprašymą ir prideda šaltinio failą naudodamas išplėstinę kalendoriaus paslaugą. Rezultatas – suplanuotas susitikimas su iš anksto paruoštu kontekstu, kurį suaktyvina viena natūralios kalbos užklausa.
El. laiškų rašymas iš „Sheets“ diagramų naudojant „Gemini Vision“
Kitas „Gemini“ įrankių rinkinio darbo procesas apima diagramos analizę „Google“ skaičiuoklėse ir „Gmail“ pranešimo parengimą remiantis ja. Įsivaizduokite, kad turite kolegijos išlaidų skaičiuoklę ir norite el. laiško, kuriame būtų apibendrinta kolegės, vardu Mary, išlaidų lentelė.
Vartotojo užklausa gali būti tokia: „Parašykite Mary el. laišką su įžvalgomis iš diagramos, esančios „CollegeExpenses“ lape.“ Įrankis, vadinamas „draftEmail“, yra apibrėžtas taip, kad priimtų „sheet_name“ ir gavėją, ir „Gemini“ pasirenka šį įrankį, kai mato tokio tipo užklausą.
Geriausios El. pašto juodraštis() Funkcija „Drive“ suranda prašomą skaičiuoklę, atidaro atitinkamą lapą, nuskaito pirmąją diagramą ir išsaugo ją kaip failą (pvz., ExpenseChart.png). Tada sukuriamas raginimas, nurodantis Dvyniams naudoti tik diagramoje esančią informaciją, vengti istorinių palyginimų ir išlaikyti glaustą žinutę.
Paskambinus callGeminiProVision(prompt, expenseChart), scenarijus siunčia ir raginimą, ir diagramos vaizdą į „Gemini Vision“, kuri grąžina pritaikytą el. laiško turinį. Galiausiai scenarijus sukuria „Gmail“ juodraštį, adresuotą gavėjo el. pašto adresu, nustato temą, pvz., „Kolegijos išlaidos“, ir prideda diagramos vaizdą.
Šis modelis Dvynius paverčia analitiku, kuris gali skaityti diagramą, išgauti pagrindinę istoriją ir suformuluoti ją natūralia kalba jūsų vardu. Jūs vis dar peržiūrite ir koreguojate juodraštį, bet didžioji dalis sunkaus darbo atliekama automatiškai.
Automatinis skaidrių rinkinių kūrimas naudojant „Gemini“ ir „Google Slides“
Trečiasis pagrindinis demonstracinis darbo eigas šiame įrankių rinkinyje automatiškai sukuria „Google Slides“ pristatymo eskizą vartotojo nurodyta tema. Pavyzdžiui, galite paklausti: „Padėkite man sudaryti klausimų ir atsakymų rinkinį apie vandens taupymą.“
Įrankis, vadinamas „createDeck“, yra deklaruojamas su vienu parametru – tema, o „Gemini“ nurodoma grąžinti struktūrizuotą JSON failą, apibūdinantį skaidrių seriją. Raginimas nurodo „Gemini“, kiek skaidrių sukurti (remiantis konstanta, pvz., NUM_SLIDES), prašo trumpų pavadinimų ir punktų bei aiškiai prašo galiojančio JSON objekto, kad scenarijus galėtų jį saugiai išanalizuoti.
Paskambinus skambinkDvyniams() su šiuo raginimu scenarijus pašalina visas formatavimo ribas, analizuoja JSON ir tada naudoja Skaidrių programa kad sukurtumėte naują pristatymą. Pirmoji skaidrė laikoma tituliniu puslapiu, o vėlesnės skaidrės laikosi TITLE_AND_BODY išdėstymo, kuriame scenarijus užpildo pavadinimą ir ženklelių tekstą.
Per kelias sekundes gausite pagrindinį skaidrės rinkinį su struktūrizuotais aptarimo punktais, kurį galėsite vizualiai pritaikyti. Nors išvestis yra sąmoningai minimali, ši darbo eiga parodo, kaip „Gemini“ gali greitai pradėti turinio struktūrą, kad galėtumėte sutelkti dėmesį į dizainą ir niuansus.
Įrankių rinkinio išplėtimas: pokalbių robotai, RAG ir daugiapakopiai įrankiai
Aukščiau pateikti pavyzdžiai yra tik atspirties taškas; platesnį „Gemini“ įrankių rinkinį galima išplėsti įvairiomis kryptimis, kai jau būsite patenkinti API ir funkcijų iškvietimu. „Google“ aiškiai siūlo keletą tyrinėjimo būdų.
Vienas populiarus naudojimo atvejis yra pokalbių robotų kūrimas „Google Chat“ naudojant „Gemini“ API. Čia galioja tie patys modeliai: jūs atskleidžiate įrankius, leidžiate „Gemini“ nuspręsti, kada juos iškviesti, ir sujungiate atsakymus atgal į pokalbių sąsają „Chat“ viduje, visa tai valdo „Chat“ API ir susijusios kodo laboratorijos.
Kita svarbi kryptis – paieškos papildytas generavimas (RAG) ant privataus turinio, esančio „Drive“ arba „Keep“ saugyklose. Užuot apibendrinę vieną tekstinį failą, galite derinti „Gemini“ API su vektorinių duomenų baze ir, pasirinktinai, orkestravimo sistema, pvz., „LangChain“, kad gautumėte atitinkamus fragmentus iš PDF failų, vaizdų ir užrašų prieš prašydami „Gemini“ sugeneruoti atsakymą, pagrįstą tais dokumentais.
Kelių posūkių funkcijų iškvietimas taip pat atveria galimybes sudėtingesniems agentams, kurie gali iteratyviai nuspręsti, kuriuos įrankius ir kokia seka naudoti. Užuot priėmęs vieną sprendimą, agentas gali iškviesti funkciją, išnagrinėti rezultatą, tada iškviesti kitą funkciją arba užduoti patikslinantį klausimą – visa tai vienoje tęstinėje gijoje.
Galiausiai, nėra reikalavimo likti „Workspace“ viduje; įvaldę „Gemini“ API šablonus, galite prijungti modelį prie išorinių API visame internete. Taip „Gemini“ iš uždaro korporacinio asistento tampa bendrosios paskirties skaitmeninio darbo orkestruotoju.
Visos šios dalys – stabilūs įrankiai, eksperimentinės laboratorijos, mokymo funkcijos, įmonių agentai ir kūrėjų API – sudaro išties turtingą „Gemini“ įrankių rinkinį, kurį gali pritaikyti tiek atsitiktiniai besimokantieji, tiek patyrę vartotojai. Jei „Gemini“ laikysite ne viena programėle, o augančiu instrumentų, kuriuos galite komponuoti, rinkiniu, turėsite puikią poziciją pasinaudoti viskuo, ką „Google“ pridės toliau, nereikėdami kaskart permąstyti viso savo darbo eigos.
Inžinierius. Technologijų, programinės ir techninės įrangos mėgėjas ir technologijų tinklaraštininkas nuo 2012 m

