Gemini Løsning - Google Chatbot (PDF)
Document Details
Uploaded by Deleted User
Tags
Summary
Denne teksten beskriver Googles Gemini-løsning, en chatbot som er integrert i ulike Google-tjenester. Teksten forklarer ulike Gemini-modeller, forskjellene mellom dem, og deres funksjoner i ulike applikasjoner. Den nevner også muligheten til å bruke Gemini i Google-dokumenter og andre tjenester.
Full Transcript
Hei, i denne videoen skal vi snakke om vårt neste nye verktøy. Og det verktøyet er Google sin Gemini-løsning, som benytter Gemini-modellene, men da i Google sin egen chatbot-interface. og nå er det verdt å påpeke at Gemini er en litt sånn rar greie også at ja, det er en chatbot men Gemini kan og er...
Hei, i denne videoen skal vi snakke om vårt neste nye verktøy. Og det verktøyet er Google sin Gemini-løsning, som benytter Gemini-modellene, men da i Google sin egen chatbot-interface. og nå er det verdt å påpeke at Gemini er en litt sånn rar greie også at ja, det er en chatbot men Gemini kan og er så mye mer, så det er også en integrasjon inn i Google tjenester jeg har ikke planlagt at vi skal se veldig mye på det det er mulig at vi kommer til å leke litt med Gemini i Google sine verktøy Google Docs, Google Sheet, Google Drive og så videre senere, men hovedsakelig så kommer vi til å se på Gemini som en chatbot, altså akkurat som chat-typeti, cloud, perplexity og alle disse andre løsningene. Altså en enkel chatbot som vi snakker med og får svar fra. Og Google sin løsning har jo en del forskjeller og likheter med de andre modellene, så dette her kommer nok ikke til å være noe sånn kjempelang video, fordi vi vet hvordan vi bruker en chatbot nå, men det er et godt verktøy å benytte, og det er jo også noe de skal bruke i obligatoriske oppgaver og så videre. Så, og denne her har jo også hatt veldig mange navn, jeg snakket jo om det når vi snakket om Microsoft sin Copilot-løsning, så hadde den mange navn før den nå heter kun Microsoft Copilot, og det samme gjelder Google, den har hatt Bard og Bard Advanced, Gemini Advanced og så videre, det har vært veldig mye modellnavn frem og tilbake her, men nå heter den Google Gemini og benytter Gemini som modellnavn også. Det er litt komponisert dette, fordi Google har veldig mange modeller. De har også en del open source-modeller som det er mulig å laste ned, men i Gemini-interfacet er det mulig å bruke Gemini 1 Ultra, og det er en Aster-eksplodent fordi den er ikke tilgjengelig i gratisversjonen. Du har også Gemini 1 Pro, som heller ikke er tilgjengelig i gratisversjonen. Gemini Ultra er den kraftigste modellen, Gemini 1 Pro er den nest kraftigste modellen, også med en Asterix der. Og så har man Gemini 1 Flash. Også en Asterix på den, fordi den er ikke tilgjengelig nå lenger, fordi Google lanserte disse for noen måneder siden, men nå er de på nye modeller igjen. Gemini 1 Nano er beregnet på mobiltelefoner, derfor er den en Asterix, for den er beregnet på å kunne bruke på for eksempel en Google Pixel-enhet, altså en Google-mobiltelefon. Og så har man Gemini 1.5 Pro, som er den kraftigste modellen per dag. Selv om de har en 1 Ultra, så er 1.5 Pro kraftigere. Og så har de en 1.5 Flash. Grunnen til at 1.5 Flash ikke har noen asterisk på seg, er fordi 1.5 Flash er den primære modellen som blir brukt i Google sin Gemini-verte, altså chatbotten til Google bruker 1.5 Flash. Og så har vi nå fått den helt nye som heter Google Gemini 1.5 Pro Experimental og litt spesielt, den er ikke tilgjengelig i noe chat-interface, heller ikke hvis du har Pro-versjonen, den er kun tilgjengelig i API og i sånn som LLM Leaderboard Arena og så videre, men det er jo da den nyeste kraftigste, absolutt kraftigste modellen som på mange måter også konkurrerer med GPT-4O og CLAD 3, 5 og så videre så dette her er jo liksom den kraftigste modellen så derfor har jeg valgt å ta den med selv om den nå ikke er tilgjengelig for annet enn API-bruk og i Arena og så videre også finnes det en rekke open source-modeller fra Google, og det finnes også eller kommer også 1.5 Pro eller 1.5 Ultra og Google har en litt sånn kaotisk tilnærming til dette med kunstig intelligens men 1.5 Pro som er da den beste modellen per i dag, dette her gjelder også 1.5 Pro Experimental, den har den nyeste modellen. Kontekstvinduet er 2 millioner tokens. Yes, det største vi har sett frem til nå er jo KLAAD med 200 000. Denne har 2 millioner, kan også utvides opp til 10 millioner tokens kontekstvinduet, som betyr at den kan ha utrolig mye kontekstinformasjon for spørringene dine. Output Max er fortsatt 8192 tokens, så det er samme som for eksempel Clad 3.5, men den kan da ha 2 millioner bakgrunnskontekst tokens fra ditt spørsmål, eller fra data du laster opp for eksempel. Den er multimodal, og den har kunnskap frem til november 2023. De fleste modellene er nå til rundt november-desember 2023. Alt som har skjedd i 2024 vet de veldig lite om. Forskjellen her er at Google sine modeller har tilgang til internett. ChatGPT har også det. Cloud har ikke det. Mens Google sin Gemini-løsning har tilgang til internett, så betyr det at den kan søke etter oppdatert informasjon. Gemini og N5 Pro er kun tilgjengelige hvis du har et betalingsabonnement. jeg har ikke et betalingsabonnement på Google Gemini løsningene enda, fordi det er veldig komplisert du må ha noe Google Gemini One AI løsning knyttet til din Google, det er veldig komplisert, så jeg anbefaler heller å teste Gemini 1.5 Pro i Leaderboard Arena fra Hagen Face eller andre steder som gir deg tilgang til API bruk, fordi Google sine løsninger har hatt en litt sånn kompliserte tilnærming til seg. 1.5 Flash, det er den raskeste modellen, og det er, den har en kontekstvindu på 1 million tokens. Regner med at det kanskje etter hvert oppdateres til 2, bare fordi 1.5 Pro har det, og max output tokens 8192. Den har også multimodal kunnskap til november 2023, og den har også tilgang til internet, og dette er modellen som er tilgang, eller som du har tilgang til, i Google sitt Gemini, eller Google sin Gemini chatbot løsning, så får du tilgang til denne. Og dette er også en av modellene dere skal bruke i den første eller andre oblingen, hvor dere skal se på forskjellige modeller. Og da skal dere bruke 1.5 Flash. Det kan godt være at innen den tid er det Gemini 2 Flash, who knows, men per nå er det 1.5 Flash som er tilgjengelig i gratis interface til Google. Og det er vel egentlig det jeg hadde planlagt om å si om disse modellene. og om Gemini sin løsning. Jeg skal vise dere løsningen også. Men en chatbot er i stor grad i dag en chatbot. Men Google har noen spennende løsninger, så derfor ser vi også på hva de tilbyr. Og de kontinuerlig oppdaterer alt mulig rart. Det er bare det at det er litt begrensninger på hvilke modeller du kan bruke i gratisversjonen. Så per i dag er det ikke de kraftigste modellene, sånn som det er også for eksempel Gemini, eller også Cloud og ChatGPT. men Google sin Gemini løsning som dere ser så er allerede logget inn og det er fordi jeg er logget inn på min Google konto, går du til gemini.google.com så kommer du automatisk inn og du trenger ikke egentlig å opprette noe om du mangler, det eksisterer hvis du har en Google konto, hvis du ikke har det så må du opprette en Google konto for å få tilgang og da får du tilgang til grensesnittet deres her får jeg beskjed om at Gemini has just been updated, og jeg regner med at hvis jeg trykker på den, så står det yes, den 15. august, som er fem dager siden jeg spiller inn dette, og da er det oppdatering til Gemini Advanced, før det tilhører til 10-åringer, Gemini 1.5 Flash, og så videre. Så de oppdaterer løsningene seg relativt ofte, men her er det akkurat det samme som ellers. Du kan trykke på på ikonet ditt for å få informasjon om konton din. Ønsker du å gjøre innstillingen i Gemini, så er det et settings-vindu her nede. Der får du velge dark theme, eller light theme. Det er sitt. Du kan se app activities og hjelp. Du har også muligheten til å se chattene dine. Og du kan opprette en ny chat. Det er egentlig de valgene du har i Google sin Gemini-løsning, og så kan du stille spørsmål. og det jeg har nå begynt å alltid prøve å stille disse modellene, nå har jeg prøvd å laste opp bilder i det siste, kanskje vi skal gjøre det i stedet. Så hvis jeg vil, så kan jeg laste opp et bilde, og da får jeg beskjed om at når du laster det opp, så kan du se dem i chats, du kan også slette prompts og så videre, ja, det er helt greit for meg. Jeg vil laste opp et bilde, og der har vi det samme bildet med dette trafikkskiltet. Can you describe the graphic sign of this image? Så får vi se om den fungerer på det nå. Gemini er også multimodal. Jeg vil si at jeg likte svaret fra Claude Pedre. Han forklarte at dette her antageligvis handler om at det er en stor sannsynlig for folk å gjøre sykkeltriks på denne veien, men her er det bare en, altså helt korrekt, men der er det en sykkelist i svart siluett som ligger på toppen av sykkelen sin. Men det står lying on their back, og det ser ut som om de ligger på magen, så ikke helt riktig, Gemini. og så står det at det er et gult skilt med svart kant, og at det er et rektangulært skilt under med karsen i sorte bokstaver. Og det er jo helt riktig, altså nesten helt riktig i hvert fall. En forskjell her er at den har også såkalt drafts, så her kan du se at den genererte tre versjoner av den teksten. Her kan vi også se, her er den også upside down, ja, draft 3 upside down underback jeg mener jo at det ser ut som han ligger på magen, men ja, det er kanskje på meg men her har du muligheten til å velge hvilket draft du ønsker fordi den genererer alltid 3 utkast før den gir deg et svar og her kan du også modifisere det ved å gjøre det lengre, kortere enklere, more casual, more professional du kan stemme opp og ned det er jo da for å trene fremtidige modeller Du kan dele og eksportere, eller du kan google it. Så hvis jeg trykker google it, så gir den meg forslag til google søk. Kanskje ikke så nyttig. Jeg regner med at den ikke kommer til å klare å beskrive det bildet i google. Og så kan du også kopiere og report problems. Og det er vel egentlig det Google Gemini er per i dag. nå er det, som jeg sa, så er det en del Google holder på å integrere Gemini-modellene sine og AI-models generelt i alle sine tjenester så det er også, hvis du har en Google Drive-konto hvis du har en Google Sheets Google Word Docs, så er det også en stor sannsynlig at du veldig snart får tilgang til en Gemini-modell i den men det er også mulig at du må betale for det det har vært litt sånn opp og ned Man får teste, men ikke egentlig. Også i Google Søk har du muligheten til å få Google AI-enabled search, men der har det vært en del ikke fullt så gode resultater i det siste. Så jeg tror faktisk de har pauset det. Nå har jeg faktisk lyst til å sjekke, for jeg er ikke sikker på om Google har implementert det. Jeg spør om det kan generere bilde, og da får jeg beskjed om at det kan ikke. Det var noe som var tilgjengelig en stund, men så hadde det litt problemer med bildegeneringsmodellen sin, så det ser ut som om jeg fjernet det igjen. Så da er det per nå, så er det Microsoft Copilot av de verktøyene vi har sett på, som kan generere bilder for dere. yes, jeg tenker det er ikke så veldig mye mer vi trenger å si om Google Gemini, vi skal bruke det litt senere i emnet og eksperimentere og teste dette mot andre løsninger, men dette her var bare sånn så dere faktisk kommer i gang og begynner å teste modellen jeg anbefaler å gjøre det, gratis sånn jeg vet så er det ikke noen begrensninger i antall spørsmål det er bare at du får kun lov til å bruke Gemini 1.5 Flash ok da tenker jeg Undertekster av Ai-Media