ChatGPT vs Gemini Deep Research: Welke AI-agent is beter?

ChatGPT vs Gemini Deep Research: Welke AI-agent is beter?

OpenAI en Google zijn momenteel opgesloten in de race om de beste diepe onderzoeksagent aan te bieden. De diepe onderzoeksagent van Gemini wordt aangedreven door het nieuwe Gemini 2.0 Flash Thinking Model, terwijl de diepe onderzoeksagent van Chatgpt een verfijnde versie van het O3-model gebruikt. Het interessante om hier op te merken is dat Google zijn agent gratis aanbiedt, terwijl Openai $ 20 in rekening brengt. Desondanks hebben we zowel de diepe onderzoeksagenten van Google als Openai op de proef gesteld, dus laten we eens kijken hoe ze het stapelen.

Taak #1: onderzoek naar de opkomst van China in AI

Om de diepe onderzoeksagent in Chatgpt en Gemini te testen, vroeg ik hen om diepgaand onderzoek te doen naar de opkomst van China op het gebied van AI. Ik vroeg beide agenten om toonaangevende AI -bedrijven in China te analyseren, wat het overheidsbeleid is, concurrentie met Amerikaanse laboratoria en meer.

Chatgpt Deep Research Agent duurde 10 minuten om de taak te voltooien en citeerde 30 verschillende bronnen, wat resulteerde in een rapport van 9.000 woorden. Aan de andere kant heeft Gemini’s diepe onderzoeksagent 8 minuten onderzocht en een veel kleiner rapport van 3000 woorden gegenereerd. Het analyseerde echter meer dan 170 websites, wat geweldig is.

Wat de onderzoeksoutput betreft, heb ik beide rapporten zorgvuldig beoordeeld en ontdekte ik dat De diepe onderzoeksagent van Chatgpt is volledig mislukt Om de recente AI -vooruitgang van China te noemen. Het noemde zelfs Deepseek R1, het nieuwe Ernie 4.5 -model van Baidu, en meer.

Het blijkt dat de diepe onderzoeksagent van Chatgpt sterk vertrouwde op een Stanford -artikel en een Wikipedia -pagina die respectievelijk werden gepubliceerd en voor het laatst bijgewerkt in 2017 en 2024. Als gevolg hiervan was de meeste informatie verouderd. Het raakte niet eens aan de nieuwste modellen voor het genereren van video’s en robotica -bedrijven.

Gemini Deep Research Agent on China's AI -opkomst

De diepe onderzoeksagent van Gemini, terwijl hij beknopt was, zei: ‘Opvallend is dat Deepseek, een startup in 2024, snel is gestegen tot bekendheid met zijn R1 -model.“Bovendien schreef Gemini ook:”Deepseek heeft zich ook onderscheiden door zijn baanbrekende werk bij het ontwikkelen van nieuwe architecturale vooruitgang, zoals multi-head latente aandacht (MLA).

In relatie :  Beengeleidingstechnologie: hoe het werkt en waar het wordt gebruikt
Lees ook:

Chatgpt O1 vs Deepseek R1: Battle of Frontier AI -modellen

Het besprak ook AI-tools van video-generatie zoals Kling AI, Minimax en AI-gedreven robotica-bedrijven zoals Unitree. Mijn beoordeling is dat Gemini’s voordeel is de zoekindex van Googledie regelmatig wordt bijgewerkt met nieuwe webpagina’s over elk onderwerp. Openai vertrouwt waarschijnlijk op Bing om webpagina’s te samenstellen voor onderzoekswerk, en als gevolg daarvan is het oude informatie samengesteld.

Taak #2: onderzoek naar de toekomst van AI -chips over NVIDIA GPU’s

In de volgende taak vroeg ik de Deep Research Agent op Chatgpt en Gemini om de toekomst van gespecialiseerde AI -chips te onderzoeken over Nvidia GPU’s die momenteel worden gebruikt voor training en meer. Chatgpt bevatte 22 bronnen en genereerde een groot document met tabellen en in-line citaten. Gemini analyseerde, net als eerder, meer dan 100 webpagina’s maar creëerde een kort document.

Chatgpt Deep Research Agent op AI -chips

Beide agenten noemden de opkomst van TPU’s, Asics, FPGA’s, LPU’s en WSE’s, en meldden de CUDA -gracht van Nvidia. Ze bespraken ook nieuwe siliciumbedrijven zoals GROQ, Cerebra’s, Sambanova, GraphCore en anderen. Chatgpt’s diepe onderzoek AI Agent raakte ook aan Huawei’s Ascend AI -chip, die Gemini miste.

Lees ook:

NVIDIA -concurrenten: AI -chipmakers die vechten tegen de Silicon War

Chatgpt Deep Research noemde ook Amazon’s Trainium- en Inferentia -chips, de Maia Chip van Microsoft, Intel’s Gaudi Accelerator en Google’s TPU. Net als zijn vorige rommel, zit Chatgpt echter vast in het verleden. Het heeft bijvoorbeeld geen informatie dat Google de TPU V6E (Trillium) chip al heeft vrijgegeven. Vervolgens denkt Chatgpt dat Nvidia’s Blackwell B200 een aankomende GPU is, maar het werd uitgebracht in 2024.

Gemini Deep Research Agent op AI -chips

Ondanks zijn missers zou ik het aan de diepe onderzoeksagent van Chatgpt geven, omdat het rapport meer diepte en inzichten heeft dan Gemini. Dat gezegd hebbende, het is belangrijk op te merken dat er een fundamenteel probleem is met de diepe onderzoeksagent van Chatgpt.

Lees ook:

5 dingen chatgpt o3-mini doet beter dan andere AI-modellen

De agent wordt aangedreven door een verfijnde versie van het O3-model van OpenAI, dat een trainingsuitsluitingsdatum van oktober 2024 heeft. Als gevolg hiervan heeft het interne model niet de nieuwste kennis. Ondanks het gebruik van internet voor actuele informatie, mist het vaak de nieuwste vooruitgang.

Taak #3: Onderzoek naar obesitasbeheer in 2025

In de derde taak vroeg ik de diepe onderzoeksagent op Chatgpt en Gemini om in 2025 obesitasbeheer te onderzoeken. Ik vroeg beide agenten specifiek om de nieuwste vooruitgang in 2025 op te nemen, met allerlei therapieën. Het diepe onderzoek van Chatgpt citeerde hoogwaardige bronnen en medische tijdschriften om de huidige therapie bij obesitasbeheer te verklaren.

Chatgpt Deep Research Agent on Obesity Management

Het noemde nieuwe doorbraken zoals GLP-1-peptiden, hun bijwerkingen, de FDA-goedkeuringsstatus van nieuwe geneesmiddelen en zelfs gentherapie. Over het algemeen onderstreepte Chatgpt het huidige obesitasbeheerbeleid van de VS, het VK en Canada.

In relatie :  Hoe u standaardapps op een Android-telefoon of -tablet kunt resetten

Aan de andere kant heeft Gemini’s diepe onderzoeksagent ook geweldig werk verricht. Het vermeldde alle medische interventies en opgenomen Aankomende drugsproeven in een tabelformaat. Wat ik interessant vond, is dat Gemini nieuwe medicijnen noemde, zoals de drievoudige hormoonreceptor (retatrutide), die een buzz creëert op medisch gebied voor aanzienlijk gewichtsverlies.

Gemini Deep Research Agent on Obesity Management

Bovendien dook Googlr’d Tweeling diep in bedrijven als Novo Nordisk en Eli Lilly, die experimenteren met nieuwe medicijnen voor gewichtsvermindering, waardoor een volledig beeld van de ontwikkeling. Al met al zou ik zeggen dat het gegenereerde rapport van Gemini goed gestructureerd was en de laatste informatie over obesitasbeheer opgenomen.

Moet u Chatgpt diep onderzoek of Gemini diep onderzoek gebruiken?

In mijn testen gaf ik de voorkeur aan Gemini’s Deep Research AI -agent omdat het consequent de huidige informatie over verschillende onderwerpen bevatte. Terwijl de diepe onderzoeksagent van Chatgpt een breed scala aan ideeën bestrijkt, belemmert de beperkte kennis van de nieuwste ontwikkeling het om een ​​volledig beeld te geven. Bovendien is Gemini’s diepe onderzoek AI Agent gratis voor alle gebruikers, terwijl OpenAI $ 20 in rekening brengt om toegang te krijgen tot de agent.

De reden dat Gemini zo beter is geworden, is dat het nu wordt aangedreven door het Gemini 2.0 Flash Thinking Model. In vergelijking met het vorige Gemini 1.5 Pro -model denkt en plant het nieuwe redeneermodel welke informatie het nodig heeft om het onderzoekswerk te voltooien.

Dat gezegd hebbende, een groot voordeel van de diepe onderzoeksagent van Chatgpt is dat u bestanden kunt uploaden, terwijl Gemini niet toestaat om bestandsuploads toe te staan ​​tijdens het gebruik van de agent. Dit kan met name nuttig zijn in STEM-gerelateerd onderzoekswerk waar u PDF’s van betaalbare wetenschappelijke tijdschriften kunt uploaden.

Aangezien veel van deze tijdschriften achter een paywall staan ​​en ontoegankelijk zijn via zoekopdrachten, kunt u bestanden handmatig uploaden om een ​​rijkere kennisbasis te bieden. Hierdoor kan de agent waardevolle inzichten opnemen. Gemini laat u echter het gegenereerde rapport exporteren naar Google Documenten, wat nuttig is voor het delen.

Al met al raad ik aan Gemini’s Deep Research AI -agent te gebruiken voordat ik het abonneert op het Chatgpt Plus -plan. Google heeft de agent aanzienlijk verbeterd en het is nu veel sneller.

Moyens I/O Staff heeft je gemotiveerd door je advies te geven over technologie, persoonlijke ontwikkeling, levensstijl en strategieën die je zullen helpen.