Cześć! Jak wiecie, świat sztucznej inteligencji rozwija się w zawrotnym tempie, a śledzenie wszystkich nowości bywa sporym wyzwaniem. Mam ogromną przyjemność być częstym gościem w podcaście AI Lunch by sensai.academy, gdzie na bieżąco analizujemy i dyskutujemy o najważniejszych przełomach w branży.

Postanowiłem zebrać w jednym miejscu skróty czterech kluczowych odcinków z moim udziałem. To prawdziwa podróż przez ostatnie miesiące rewolucji AI – od wyścigu na najlepsze modele językowe, przez narodziny autonomicznych agentów, aż po rewolucyjne nowości od Google. Zapraszam do lektury i słuchania!

AI Lunch #18: Gdy chińskie modele wyprzedziły OpenAI…

Ten odcinek był prawdziwym trzęsieniem ziemi. Skupiliśmy się na rewolucji, jaką wywołały chińskie firmy, pokazując, że dominacja OpenAI nie jest dana raz na zawsze.

  • Główny temat to chiński startup DeepSeek, którego model w benchmarkach pobił GPT-4, oferując przy tym niższe koszty uczenia dzięki metodzie Mixture of Experts.
  • Omówiliśmy kontrowersje wokół zarzutów Microsoftu o to, że DeepSeek mógł trenować się na danych OpenAI, co doprowadziło do ograniczeń dla chińskich firm.
  • Zaraz potem Alibaba zaprezentowała swoje modele Qwen 2.5 Max (lepszy od DeepSeek) oraz Qwen 2.5 1 Million z gigantycznym, milionowym oknem kontekstowym.
  • Dyskutowaliśmy o odpowiedzi gigantów: ChatGPT Gov od OpenAI dla rządu oraz o „War Room” w Meta i gigantycznych inwestycjach w infrastrukturę AI.
  • Wspomnieliśmy też o nowościach od OpenAI: Canvas do interaktywnego kodowania oraz Operator – autonomicznym agencie do wykonywania zadań w świecie rzeczywistym.
  • Nie zabrakło też gratulacji dla polskiej firmy Eleven Labs, która osiągnęła wycenę 3 miliardów dolarów.

AI Lunch #24: Narodziny agentów AI i chiński MANUS

Zaledwie kilka tygodni później tematem numer jeden stali się autonomiczni agenci AI, a chiński projekt MANUS wywołał dyskusję, czy jesteśmy o krok od AGI (sztucznej inteligencji ogólnej).

  • Główny bohater to MANUS – chiński agent AI zdolny do wykonywania złożonych operacji i pisania skryptów przy użyciu 29 różnych narzędzi.
  • Przedstawiliśmy Claude Code od Anthropic – wyspecjalizowanego agenta do kodowania, a także Agent SDK od OpenAI do tworzenia własnych agentów.
  • Google odpowiedziało rodziną małych modeli Gemma 3, które mogą działać lokalnie, nawet na niewielkich urządzeniach, co jest kluczowe dla rozwoju agentów offline.
  • W tym odcinku miałem też okazję zademonstrować swoje autorskie narzędzia: agenta do streszczania stron oraz graf wiedzy AI, który wizualizuje powiązania w świecie technologii.

AI Lunch #33: Google I/O 2025 – Nowa Era Wyszukiwania i Interakcji

Ten odcinek był w całości poświęcony przełomowym zapowiedziom z konferencji Google I/O 2025, które na nowo definiują to, jak korzystamy z internetu.

  • Najważniejsza nowość to AI Search / AI Mode – pełna synteza odpowiedzi AI w wyszukiwarce, co stanowi absolutną zmianę paradygmatu i może wstrząsnąć rynkiem SEO.
  • Przedstawiliśmy Project Astra – uniwersalnego asystenta AI, który widzi i rozumie świat przez kamerę telefonu.
  • Google ogłosiło Gemini 2.5 Pro najlepszym modelem na świecie i zaprezentowało rewolucyjny model dyfuzji tekstu Gemini Diffusion, który generuje tekst z szumu z niesamowitą prędkością.
  • Omówiliśmy też potężne narzędzia kreatywne: Veo 3 (wideo z głosem), Imagine 4 (obrazy i typografia) oraz Flow (edytor łączący wszystkie te narzędzia).
  • Dyskutowaliśmy o ogromnych inwestycjach Google w elektrownie atomowe na potrzeby energetyczne AI.

AI Lunch #36: „Jarvis” od ElevenLabs i przyszłość zdecentralizowanych narzędzi

W najnowszej rozmowie skupiliśmy się na personalnych asystentach i standardach, które pozwolą różnym narzędziom AI ze sobą „rozmawiać”.

  • Zaczęliśmy od prezentacji agenta od Eleven Labs – personalnego asystenta AI przypominającego filmowego Jarvisa, który może mówić naszym głosem i łączyć się z różnymi aplikacjami.
  • Omówiliśmy protokół MCP Server, który jest uważany za ujednolicony standard do łączenia narzędzi, umożliwiając agentom dostęp do Notion, Slacka i wielu innych.
  • Poruszyliśmy też gorący temat praw autorskich w kontekście pozwu przeciwko Antropic.
  • Wróciły też nowości ze świata wideo: Midjourney V7 z opcją generowania wideo z klatek oraz Runway Gen 4 z funkcją „references” do tworzenia spójnych animacji.
  • W części praktycznej zademonstrowałem Code with Rode – wtyczkę do VS Code, która potrafi pisać i optymalizować całe aplikacje w kilka minut, a także pokazałem, jak generować modele 3D z obrazów i drukować je w 3D.

Mam nadzieję, że to skondensowane podsumowanie okaże się dla Was przydatne. Świat AI pędzi do przodu, a ja cieszę się, że mogę dzielić się z Wami najciekawszymi nowinkami. Koniecznie zasubskrybujcie kanał SensAI Academy, aby nie przegapić kolejnych odcinków AI Lunch!