← BlogGrowth hacks8 min czytania

Freemium w AI nie działa: 5 modeli monetyzacji SaaS

Freemium w SaaS opierał się na zerowym koszcie krańcowym. W AI to założenie się skończyło i każdy darmowy user pali Twoją marżę.

Adrian SerafinFractional CMO · 6.05.2026

TL;DR

Freemium w klasycznym SaaS działał, bo koszt obsłużenia jednego dodatkowego usera był bliski zeru. W produktach AI to założenie się skończyło, ponieważ każdy prompt, każda inferencja i każdy token kosztują realne pieniądze, których Twój CFO nie odzyska deklaracjami o "produkt-led growth".
Trzy największe pułapki monetyzacji AI to: dawanie za darmo modelu, który kosztuje Cię trzy dolary za sesję, mierzenie sukcesu liczbą zarejestrowanych userów zamiast unit economics oraz kopiowanie cennika konkurencji bez sprawdzenia, czy ktokolwiek tam zarabia.
Działa pięć modeli, każdy w innym kontekście: usage-based z hard capem, hybrid seat plus usage, value-based z outcome pricingiem, reverse trial siedmiodniowy oraz freemium z brutalnie ograniczonym GPU budżetem na user.
Najprostszy test, czy Twój pricing AI ma sens: policz koszt inferencji per aktywny user miesięcznie, podziel przez ARPU i sprawdź, czy zostaje Ci więcej niż 30%. Jeśli nie, nie masz pricingu, masz subsydiowaną demonstrację cudzych GPU.

Liczby branżowe, które warto znać

$4-18 miesięcznie

KOSZT INFERENCJI PER USER (chat AI B2B)

Estymata na podstawie danych OpenAI/Anthropic API, mid-2025

75-85%

GROSS MARGIN klasyczny SaaS

KeyBanc SaaS Survey, 2024

40-65%

GROSS MARGIN AI-native SaaS

a16z, "Emerging Architectures for LLM Applications", 2024

2-5%

FREE-TO-PAID conversion klasyczny freemium

OpenView Product Benchmarks, 2023

0,8-2,2%

FREE-TO-PAID conversion w AI productach

Lenny's Newsletter referencing OpenView, 2025

12-18 miesięcy

CAC payback B2B SaaS poniżej $50k ACV

SaaS Capital, 2024

Freemium w SaaS narodził się w epoce, w której serwer kosztował tyle samo niezależnie od tego, czy obsługiwał stu, czy stu pięćdziesięciu zarejestrowanych userów. Marginalny koszt jednego dodatkowego konta na Mailchimpie z 2012 roku zaokrąglał się do zera, więc dawanie produktu za darmo było równoznaczne z robieniem marketingu. Dziś, kiedy każdy chat ze ślicznie zbudowanym AI assistantem konsumuje tokeny, za które OpenAI lub Anthropic wystawiają konkretną fakturę, ta logika ma się tak do rzeczywistości jak biznesplan otwarcia restauracji w centrum Warszawy z założeniem, że jedzenie będzie darmowe, a zarobimy na napojach.

Freemium w produktach AI to dziś najczęstsze źródło spalania runwayu w startupach, z którymi rozmawiam jako Fractional CMO, i jednocześnie najtrudniejszy temat do otwarcia z founderem, który dwa lata temu czytał, że PLG zawsze działa. Skala problemu rośnie, bo darmowi userzy AI nie tylko nie konwertują tak, jak konwertowali w SaaS, oni jeszcze realnie kosztują, a różnica między marżą klasycznego SaaS na poziomie 80% a AI-native SaaS na poziomie 50% to nie jest zaokrąglenie księgowe. To różnica między firmą, która ma prawo istnieć, a firmą, która istnieje, dopóki kolejna runda nie wyschnie.

Dlaczego klasyczny freemium nie przenosi się 1:1 do AI

Pierwszy raz zobaczyłem ten mechanizm na żywo wiosną 2025 roku u software house z Trójmiasta, który zbudował własnego AI copywritera dla agencji marketingowych. Mieli 4 200 darmowych userów, z czego 380 płaciło 29 euro miesięcznie. Liczby na pierwszy rzut oka klasyczne: 9% conversion, brzmi nieźle. Tyle że obliczyli realny koszt inferencji na darmowego usera i wyszło 6,40 euro miesięcznie. Czyli te 3 820 darmowych kont generowało 24 448 euro kosztów, podczas gdy płatni przynosili 11 020 euro przychodu. Firma traciła ponad 13 tysięcy euro miesięcznie tylko na różnicy między darmowym a płatnym tierem, zanim w ogóle zaczęli mówić o pensjach, budżecie paid i hostingu.

To, co się stało, jest banalnie proste i jednocześnie bolesne dla każdego, kto wychowywał się na książce o lean startupie:

W klasycznym SaaS koszt obsłużenia darmowego usera był marketingowym wydatkiem amortyzowanym przyszłymi płatnymi userami z tego samego segmentu.
W AI koszt darmowego usera jest realnym, miesięcznym wydatkiem na cudze GPU, który nie znika, dopóki user się nie wyloguje na zawsze.
Im lepszy jest Twój produkt AI, tym więcej darmowy user z niego korzysta, tym więcej płacisz Anthropicowi, Open AI lub Google’owi i tym szybciej zwiększasz stratę.

Twierdzenie, że ten model "skaluje się jak każdy SaaS", przypomina mi tezę kierowcy, który po obejrzeniu Formuły 1 stwierdza, że jego rodzinne kombi też pojedzie 350 km/h, jeśli tylko wystarczająco mocno wciśnie pedał. Pedał można wcisnąć, koszt opon i paliwa pozostaje bez zmian.

Pięć modeli monetyzacji, które realnie działają w AI

Po przejściu przez kilkanaście pricing reviews dla klientów Fractional CMO w 2024 i 2025 roku zostało mi pięć modeli, które wytrzymują kontakt z faktycznymi unit economics. Każdy ma swój kontekst.

Model	Kiedy działa	Główne ryzyko
Usage-based z hard capem	Klient profesjonalny, B2B, zna swój wolumen	Cap zbyt nisko = frustracja, zbyt wysoko = bleed
Hybrid seat + usage	Zespoły 5-50 osób z mieszanym wolumenem	Komplikacja faktury, wymaga edukacji sales
Value-based / outcome pricing	Mierzalny wynik (lead, deal, godzina)	Trudne do egzekwowania, długi sales cycle
Reverse trial 7-14 dni	Self-serve B2B SaaS poniżej $200 ACV	Niski czas na "aha moment", potrzeba świetnego onboardingu
Freemium z GPU budżetem na user	Bottom-up enterprise, długi PLG	Wymaga dyscypliny w monitoringu kosztów

Usage-based pricing z hard capem to mój default rekomendacja dla startupów AI, które sprzedają w B2B i mają jasno zdefiniowany jednostkowy koszt operacji. Liczysz koszt inferencji per zapytanie, nakładasz marżę 60-70% i sprzedajesz pakiety. Hard cap chroni Cię przed userem, który włącza skrypt na noc i wyciska z Ciebie 40 tysięcy zapytań przed śniadaniem.

Reverse trial zamiast freemium daje siedem do czternastu dni pełnego dostępu, po czym user przechodzi na ograniczony plan free albo paid. Wyciąłem nim w jednym B2B SaaSie 73% darmowych userów po 14 dniach, co obniżyło koszt GPU o 9 800 dolarów miesięcznie, a conversion paid wzrósł z 1,4% do 3,1%. Dlaczego? Bo user ma realny powód, żeby się zaangażować, zamiast leniwie tkwić w darmowym tierze przez sześć miesięcy.

Pytanie, którego nikt nie chce zadać

Czy Twój pricing AI naprawdę zarabia, czy tylko subsydiuje cudze GPU pod pretekstem growth marketingu?

Test jest prosty. Weź ostatni miesiąc, policz całkowity koszt inferencji (API calls do OpenAI, Anthropic, własny hosting modeli), podziel przez liczbę aktywnych userów, w tym darmowych. Otrzymujesz koszt na user. Następnie weź MRR i podziel przez liczbę płatnych userów. Otrzymujesz ARPU. Jeśli koszt na user (wszystkich) przekracza 30% ARPU (płacących), masz problem strukturalny, nie marketingowy.

Spotkałem trzy firmy w 2025 roku, które po przeprowadzeniu tego ćwiczenia zmieniły model w ciągu sześciu tygodni. Każda z nich na początku rozmowy mówiła "ale my mamy świetny PLG i NPS 67". Świetny NPS przy ujemnej marży to dobry argument do podcastu, słaby argument do kolejnej rundy.

Co zrobić w tym kwartale, jeśli sprzedajesz AI

Jeśli Twój produkt AI ma freemium i nie czytałeś własnego rachunku za GPU od trzech miesięcy, zacznij od audytu unit economics, zanim zmienisz cokolwiek w copy na stronie. Umów konsultację, jeśli chcesz pracować nad tym z kimś z zewnątrz, albo policz to sam: ile kosztuje Cię miesięcznie obsłużenie tysiąca darmowych userów i jakim procentem ARPU płatnych userów to jest. Jeśli wynik Cię zaskoczy, nie jesteś sam. Większość founderów dowiaduje się o swojej marży dopiero wtedy, gdy zaczyna szukać kolejnej rundy i due diligence inwestora wyciąga to na powierzchnię. Wtedy jest już znacznie drożej.

Dla zespołów, które rozważają fractional model wsparcia w GTM dla produktu AI, policz koszt CMO etatowego versus Fractional i sprawdź, w którym punkcie zaczyna się sens jednego albo drugiego.

Inspiracja: Why SaaS freemium playbooks don't work in AI, and what to do instead, Lenny's Newsletter

Checklist wdrożenia

01Policz całkowity koszt inferencji AI z ostatnich 90 dni i podziel przez średnią miesięczną liczbę aktywnych userów (płatnych plus darmowych).
02Sprawdź, jakim procentem ARPU płatnych userów jest koszt na usera, jeśli powyżej 30%, zatrzymaj nowy marketing i wróć do modelu pricingowego.
03Zidentyfikuj 10% darmowych userów generujących 80% kosztu inferencji i zdecyduj, czy to potencjalni płatni klienci, czy tylko abuse.
04Wprowadź hard cap na zużycie tokenów per darmowy user w skali miesiąca, najlepiej z czytelnym komunikatem, dlaczego cap istnieje.
05Zamień freemium na reverse trial 7-14 dniowy, jeśli sprzedajesz w segmencie B2B poniżej 500 dolarów ACV.
06Przelicz pricing dla każdego planu w oparciu o realny koszt inferencji plus minimum 60% marży, nie o cennik konkurencji.
07Dodaj do swojego dashboardu jedną metrykę: koszt GPU jako procent przychodu, raportowany tygodniowo.
08Przeprowadź rozmowy z 5 płatnymi klientami i 5 long-term darmowymi userami, zapytaj, ile gotowi są zapłacić za konkretną wartość, nie za "dostęp".
09Wybierz jeden z pięciu modeli monetyzacji (usage-based z capem, hybrid, value-based, reverse trial, freemium z GPU budżetem) i zaplanuj migrację w ciągu 60 dni.
10Komunikuj zmiany pricingu istniejącym userom z minimum 30-dniowym wyprzedzeniem i wyjaśnij ekonomikę, traktując ich jak dorosłych ludzi.

Najczęstsze pytania

Czym różni się monetyzacja produktu AI od klasycznego B2B SaaS?

Klasyczny SaaS miał marginalny koszt obsłużenia dodatkowego usera bliski zeru, więc freemium działał jak tani marketing. W produktach AI każdy aktywny user generuje realny koszt inferencji liczony w tokenach API albo czasie GPU, dlatego model freemium bez hard capa najczęściej rozsadza marżę. Marża brutto AI-native SaaS oscyluje wokół 40-65% wobec 75-85% klasycznego SaaS, co zmienia całą ekonomikę GTM.

Czy freemium w AI ma jeszcze sens, czy lepiej całkowicie z niego zrezygnować?

Ma sens w trzech kontekstach: bottom-up enterprise z długim cyklem, produkty z naturalnym efektem sieciowym, oraz tam, gdzie darmowy tier jest brutalnie ograniczony GPU budżetem na user. We wszystkich pozostałych przypadkach reverse trial 7-14 dniowy daje lepsze unit economics przy podobnym lub wyższym free-to-paid conversion.

Jak policzyć koszt inferencji AI na jednego usera miesięcznie?

Weź łączny koszt API do dostawców modeli (OpenAI, Anthropic, własne GPU) z ostatnich 30 dni i podziel przez liczbę userów, którzy w tym okresie wykonali co najmniej jedną akcję wymagającą inferencji. Dla większości B2B narzędzi AI wynik mieści się w przedziale 4-18 dolarów. Jeśli nie umiesz tego policzyć w 30 minut, masz problem z observability, zanim w ogóle dojdziesz do problemu z pricingiem.

Jaki model pricingowy jest najbezpieczniejszy dla wczesnego startupu AI z ograniczonym runwayem?

Usage-based pricing z hard capem oraz minimum miesięcznym, czyli klient płaci za faktyczne zużycie, ale nigdy poniżej ustalonej kwoty bazowej i nigdy powyżej zdefiniowanego maksimum. To chroni Cię przed darmową rundą abuse i jednocześnie daje przewidywalność klientowi. Działa szczególnie dobrze w segmencie professional B2B z ACV od 200 do 2000 dolarów rocznie.

Ile czasu trzeba na zmianę modelu monetyzacji w działającym produkcie AI?

Audyt unit economics i decyzja: 2-3 tygodnie. Komunikacja zmiany istniejącym userom: 30-45 dni. Pełna migracja z nowym pricingiem na stronie, w stripe, w dokumentacji: 60-90 dni od decyzji. Najwolniejszym elementem są zwykle nie technologia ani copy, tylko emocje founderów, którzy boją się stracić darmowych userów, którzy i tak nigdy by nie zapłacili.

Czy outcome pricing (płatność za wynik) działa w produktach AI?

Działa, jeśli wynik jest mierzalny, atrybuowalny i ma jasną wartość rynkową, np. wygenerowany lead, zaoszczędzona godzina pracy, zamknięty deal. Sprawdza się szczególnie w narzędziach AI dla sprzedaży i obsługi klienta. Nie działa tam, gdzie wynik jest subiektywny ("lepszy content") albo wymaga długiego okresu pomiaru, bo cash flow startupu nie wytrzyma 90-dniowego cyklu rozliczeniowego z każdym klientem.