Cześć! Jak wiecie, świat sztucznej inteligencji rozwija się w zawrotnym tempie, a śledzenie wszystkich nowości bywa sporym wyzwaniem. Mam ogromną przyjemność być częstym gościem w podcaście AI Lunch by sensai.academy, gdzie na bieżąco analizujemy i dyskutujemy o najważniejszych przełomach w branży.
Postanowiłem zebrać w jednym miejscu skróty czterech kluczowych odcinków z moim udziałem. To prawdziwa podróż przez ostatnie miesiące rewolucji AI – od wyścigu na najlepsze modele językowe, przez narodziny autonomicznych agentów, aż po rewolucyjne nowości od Google. Zapraszam do lektury i słuchania!
AI Lunch #18: Gdy chińskie modele wyprzedziły OpenAI…
Ten odcinek był prawdziwym trzęsieniem ziemi. Skupiliśmy się na rewolucji, jaką wywołały chińskie firmy, pokazując, że dominacja OpenAI nie jest dana raz na zawsze.
- Główny temat to chiński startup DeepSeek, którego model w benchmarkach pobił GPT-4, oferując przy tym niższe koszty uczenia dzięki metodzie Mixture of Experts.
- Omówiliśmy kontrowersje wokół zarzutów Microsoftu o to, że DeepSeek mógł trenować się na danych OpenAI, co doprowadziło do ograniczeń dla chińskich firm.
- Zaraz potem Alibaba zaprezentowała swoje modele Qwen 2.5 Max (lepszy od DeepSeek) oraz Qwen 2.5 1 Million z gigantycznym, milionowym oknem kontekstowym.
- Dyskutowaliśmy o odpowiedzi gigantów: ChatGPT Gov od OpenAI dla rządu oraz o „War Room” w Meta i gigantycznych inwestycjach w infrastrukturę AI.
- Wspomnieliśmy też o nowościach od OpenAI: Canvas do interaktywnego kodowania oraz Operator – autonomicznym agencie do wykonywania zadań w świecie rzeczywistym.
- Nie zabrakło też gratulacji dla polskiej firmy Eleven Labs, która osiągnęła wycenę 3 miliardów dolarów.
AI Lunch #24: Narodziny agentów AI i chiński MANUS
Zaledwie kilka tygodni później tematem numer jeden stali się autonomiczni agenci AI, a chiński projekt MANUS wywołał dyskusję, czy jesteśmy o krok od AGI (sztucznej inteligencji ogólnej).
- Główny bohater to MANUS – chiński agent AI zdolny do wykonywania złożonych operacji i pisania skryptów przy użyciu 29 różnych narzędzi.
- Przedstawiliśmy Claude Code od Anthropic – wyspecjalizowanego agenta do kodowania, a także Agent SDK od OpenAI do tworzenia własnych agentów.
- Google odpowiedziało rodziną małych modeli Gemma 3, które mogą działać lokalnie, nawet na niewielkich urządzeniach, co jest kluczowe dla rozwoju agentów offline.
- W tym odcinku miałem też okazję zademonstrować swoje autorskie narzędzia: agenta do streszczania stron oraz graf wiedzy AI, który wizualizuje powiązania w świecie technologii.
AI Lunch #33: Google I/O 2025 – Nowa Era Wyszukiwania i Interakcji
Ten odcinek był w całości poświęcony przełomowym zapowiedziom z konferencji Google I/O 2025, które na nowo definiują to, jak korzystamy z internetu.
- Najważniejsza nowość to AI Search / AI Mode – pełna synteza odpowiedzi AI w wyszukiwarce, co stanowi absolutną zmianę paradygmatu i może wstrząsnąć rynkiem SEO.
- Przedstawiliśmy Project Astra – uniwersalnego asystenta AI, który widzi i rozumie świat przez kamerę telefonu.
- Google ogłosiło Gemini 2.5 Pro najlepszym modelem na świecie i zaprezentowało rewolucyjny model dyfuzji tekstu Gemini Diffusion, który generuje tekst z szumu z niesamowitą prędkością.
- Omówiliśmy też potężne narzędzia kreatywne: Veo 3 (wideo z głosem), Imagine 4 (obrazy i typografia) oraz Flow (edytor łączący wszystkie te narzędzia).
- Dyskutowaliśmy o ogromnych inwestycjach Google w elektrownie atomowe na potrzeby energetyczne AI.
AI Lunch #36: „Jarvis” od ElevenLabs i przyszłość zdecentralizowanych narzędzi
W najnowszej rozmowie skupiliśmy się na personalnych asystentach i standardach, które pozwolą różnym narzędziom AI ze sobą „rozmawiać”.
- Zaczęliśmy od prezentacji agenta od Eleven Labs – personalnego asystenta AI przypominającego filmowego Jarvisa, który może mówić naszym głosem i łączyć się z różnymi aplikacjami.
- Omówiliśmy protokół MCP Server, który jest uważany za ujednolicony standard do łączenia narzędzi, umożliwiając agentom dostęp do Notion, Slacka i wielu innych.
- Poruszyliśmy też gorący temat praw autorskich w kontekście pozwu przeciwko Antropic.
- Wróciły też nowości ze świata wideo: Midjourney V7 z opcją generowania wideo z klatek oraz Runway Gen 4 z funkcją „references” do tworzenia spójnych animacji.
- W części praktycznej zademonstrowałem Code with Rode – wtyczkę do VS Code, która potrafi pisać i optymalizować całe aplikacje w kilka minut, a także pokazałem, jak generować modele 3D z obrazów i drukować je w 3D.
Mam nadzieję, że to skondensowane podsumowanie okaże się dla Was przydatne. Świat AI pędzi do przodu, a ja cieszę się, że mogę dzielić się z Wami najciekawszymi nowinkami. Koniecznie zasubskrybujcie kanał SensAI Academy, aby nie przegapić kolejnych odcinków AI Lunch!
