Portfolio

Agenci AI i automatyzacje

Projektuję i wdrażam agentów AI oraz automatyzacje procesów end-to-end - od discovery i architektury, przez implementację, po testy, monitoring i wdrożenie. Specjalizuję się w rozwiązaniach, które są produkcyjne, skalowalne i bezpieczne, z naciskiem na jakość odpowiedzi (evals) oraz integracje z systemami firmy.

NDA-friendly portfolio - case studies anonimizowane lub kompozytowe
MVP szybko, bez kompromisu na jakości i stabilności
Guardrails, evals, monitoring - kontrola kosztu i jakości
Integracje: Slack/Teams, CRM, Jira, bazy danych, API, SSO

Umów rozmowę Zobacz realizacje

Wdrożenia end-to-end

Zakres współpracy

Agenci AI do pracy z narzędziami
RAG i wyszukiwanie wiedzy
Automatyzacje procesów i integracje
Produkcyjne wdrożenia i jakość

Evals

pomiar jakości odpowiedzi

Guardrails

kontrola ryzyka i kosztu

Integracje

CRM, Jira, bazy danych, API

Efekty

Typowe efekty wdrożeń

Redukcja pracy ręcznej

Automatyzacja powtarzalnych kroków i mniej operacji kopiuj-wklej.

Szybsze przygotowanie dokumentów

Oferty, podsumowania, raporty i checklisty generowane w standardzie.

Mniej błędów operacyjnych

Walidacje, audytowalność i spójność procesu.

Krótszy czas odpowiedzi

Asystenci RAG i workflowy wspierające zespoły w codziennej pracy.

Usługi

Agenci AI i automatyzacje procesów

Agenci AI do pracy z narzędziami

Agenci, którzy wykonują zadania wieloetapowe: planowanie, używanie narzędzi, weryfikacje i finalny raport.

Tool calling / function calling, workflowy wieloetapowe
Kontrola halucynacji: retrieval, cytowania, walidacje
Degradacja kontrolowana: fallbacki, tryby offline, manual review

RAG i wyszukiwanie wiedzy

Asystenci i agenci opierający się na firmowej wiedzy z dokumentów, intranetu i baz danych.

Pipeline: chunking, embeddings, vector DB, reranking
Uprawnienia i kontrola dostępu do danych
Evals jakości wyszukiwania i odpowiedzi

Automatyzacje procesów (backend + integracje)

Automatyzacje, które realnie zmniejszają koszty operacyjne i błędy, bez utraty kontroli nad procesem.

Integracje API: CRM, ERP, Jira, email, kalendarze
Kolejki i retry: niezawodność i odtwarzalność
Audytowalność: logi zdarzeń, wersjonowanie promptów

Produkcyjne wdrożenia i jakość

Zamieniam POC w produkcję - z testami, monitoringiem, SLA i przewidywalnym kosztem.

CI/CD, testy, code review, standardy jakości
Observability: tracing, metryki, alerting, dashboards
Polityki bezpieczeństwa: PII, redakcja, prompt injection defense

Case studies

NDA-friendly realizacje

Poniżej przedstawiam anonimizowane realizacje (w części kompozytowe) z projektów objętych NDA. Opisuję podejście architektoniczne, stos technologiczny i mierzalne efekty, bez ujawniania danych klienta.

Agent ofertowania i wycen

Problem

Zespół sprzedaży tracił czas na ręczne kompletowanie danych, wyliczenia i przygotowanie ofert w spójną formę.

Rozwiązanie

Zaprojektowałam agenta, który prowadzi użytkownika przez wymagania, pobiera dane z kilku źródeł (CRM, cenniki, dokumentacja), wylicza warianty oraz generuje gotowy draft oferty z uzasadnieniem i listą ryzyk. Dodałam tryb human-in-the-loop dla newralgicznych fragmentów oraz walidacje zgodności z polityką cenową.

Stack

Wynik

Krótszy czas przygotowania oferty, mniej błędów w kalkulacjach i spójniejszy standard materiałów.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: wdrożone

Asystent obsługi klienta z bazą wiedzy (RAG)

Problem

Duże obciążenie supportu przez powtarzalne pytania oraz rozproszone źródła wiedzy (PDF, wiki, procedury).

Rozwiązanie

Zbudowałam pipeline RAG z kontrolą uprawnień oraz mechanizmem cytowania źródeł. Asystent odpowiada w oparciu o aktualne dokumenty, a w razie niskiej pewności automatycznie proponuje eskalację do człowieka. Dodałam ewaluacje jakości i monitoring halucynacji.

Stack

Wynik

Odciążenie pierwszej linii wsparcia, szybsze odpowiedzi i widoczność braków w dokumentacji.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: wdrożone

Agent analizy dokumentów i zgodności (compliance)

Problem

Ręczne przeglądanie umów i dokumentów było czasochłonne, a ryzyko pominięcia kluczowych zapisów wysokie.

Rozwiązanie

Agent klasyfikuje dokument, wyciąga kluczowe klauzule, flaguje ryzyka i generuje checklistę do weryfikacji. Zastosowałam polityki PII, redakcję danych i walidacje wyników oraz eskalacje do człowieka tam, gdzie to konieczne.

Stack

Wynik

Szybszy przegląd dokumentów, lepsza powtarzalność oceny i audytowalne logi.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: wdrożone

Automatyzacja back-office (workflowy + integracje)

Problem

Zespół operacyjny obsługiwał powtarzalne procesy w wielu narzędziach, co generowało opóźnienia i błędy.

Rozwiązanie

Workflow zbiera dane z kilku systemów, waliduje je, aktualizuje rekordy i generuje podsumowanie. Dodałam kolejkowanie, retry i dead-letter queue oraz panel statusów. W newralgicznych krokach zastosowałam zatwierdzanie przez człowieka.

Stack

Wynik

Mniej pracy ręcznej, mniej błędów i lepsza przewidywalność procesu.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: wdrożone

Agent planowania i priorytetyzacji zadań

Problem

Trudność z priorytetyzacją zadań i rozbijaniem tematów na wykonalne kroki w projektach wielowątkowych.

Rozwiązanie

Agent zbiera kontekst, proponuje plan w formie backlogu oraz tworzy zadania w Jira wraz z acceptance criteria. Zastosowałam szablony i walidacje, aby utrzymać stały standard, oraz mechanizm feedbacku.

Stack

Wynik

Szybsze planowanie, lepsza jakość ticketów i mniej chaosu w priorytetach.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: opcjonalnie

Agent do raportowania i analityki (LLM + data)

Problem

Raporty były ręcznie składane z różnych źródeł, a odpowiedzi na pytania biznesu zajmowały zbyt dużo czasu.

Rozwiązanie

Bezpieczna warstwa do zadawania pytań o dane z kontrolą uprawnień. Agent generuje zapytania, uruchamia je i tłumaczy wyniki, z walidacjami, limitami kosztu i szablonami raportów.

Stack

Wynik

Szybsze odpowiedzi, standard raportowania oraz kontrola kosztu i ryzyka.

Quality & Safety checklist

Evals: wdrożone
Guardrails: wdrożone
Observability: wdrożone
Human-in-the-loop: opcjonalnie

Wizualizacje

Jak wygląda wdrożenie w praktyce

Wizualizacje pokazują typowy przebieg projektu i obszary, w których wdrożenia najczęściej przynoszą mierzalną wartość.

Obszary poprawy (indeks)

Dojrzałość rozwiązania w czasie (przykładowo)

Struktura czasu w projekcie (typowo)

Pipeline RAG

Poniżej widzisz przykładowy przebieg pipeline RAG. Na desktopie tooltipy opisują kroki, a na mobile układają się pionowo.

Źródła danych
Ingestion
Chunking
Embeddings
Vector DB
Retrieval
Reranking
Odpowiedź z cytowaniami

Proces

Jak pracuję - od pomysłu do produkcji

Pracuję iteracyjnie. Zaczynam od celu biznesowego i ograniczeń (dane, bezpieczeństwo, narzędzia), a dopiero potem dobieram modele i architekturę. W każdym etapie dbam o to, żeby rozwiązanie było mierzalne, stabilne i możliwe do utrzymania.

Discovery i analiza potrzeb

Doprecyzowujemy use case, dane, ryzyka i kryteria sukcesu.

Architektura i plan wdrożenia

Dobór architektury, integracji, plan MVP i backlog.

MVP i szybki feedback

Szybka wersja działająca i iteracje na realnych scenariuszach.

Hardening i jakość

Guardrails, evals, testy, monitoring, kontrola kosztu i bezpieczeństwo.

Wdrożenie i rozwój

Stabilne wdrożenie, dokumentacja i dalsze iteracje.

Deliverables

Diagram architektury i przepływów
Specyfikacja MVP + backlog
Wersja produkcyjna (lub pilot) z monitoringiem
Zestaw testów i evals
Dokumentacja i instrukcja utrzymania

Stack

Tech stack

Backend

AI

Data

DevOps i jakość

FAQ

Najczęstsze pytania

Czy można zobaczyć więcej szczegółów projektów?

Tak. Większość realizacji jest objęta NDA, ale mogę pokazać dodatkowe materiały po podpisaniu NDA lub w formie zanonimizowanych diagramów i przepływów.

Ile trwa MVP?

Najczęściej 1-3 tygodnie, zależy od danych i integracji. Wersja produkcyjna dojrzewa w kolejnych iteracjach.

Jak ograniczasz halucynacje?

RAG, walidacje, guardrails, evals na zestawie testowym oraz progi pewności i eskalacje do człowieka.

Jak kontrolujesz koszty LLM?

Limity, budżety per request, cache, dobieranie modeli do zadania, kompresja kontekstu.

Czy to działa po polsku?

Tak. Prompty i testy są projektowane pod język polski, a w razie potrzeby wdrażam wersję dwujęzyczną.

Jakie integracje są możliwe?

API systemów (CRM/ERP/Jira), Slack/Teams, email i kalendarze, bazy danych i źródła dokumentów.

Kontakt

Masz pomysł na agenta AI albo automatyzację procesu?

Opowiedz w 2-3 zdaniach, co chcesz usprawnić, a ja zaproponuję podejście, architekturę MVP i realny plan wdrożenia.

Napisz do mnie Umów rozmowę