Portfolio

Agenci AI i automatyzacje

Projektuję i wdrażam agentów AI oraz automatyzacje procesów end-to-end - od discovery i architektury, przez implementację, po testy, monitoring i wdrożenie. Specjalizuję się w rozwiązaniach, które są produkcyjne, skalowalne i bezpieczne, z naciskiem na jakość odpowiedzi (evals) oraz integracje z systemami firmy.

  • NDA-friendly portfolio - case studies anonimizowane lub kompozytowe
  • MVP szybko, bez kompromisu na jakości i stabilności
  • Guardrails, evals, monitoring - kontrola kosztu i jakości
  • Integracje: Slack/Teams, CRM, Jira, bazy danych, API, SSO
Wdrożenia end-to-end

Zakres współpracy

  • Agenci AI do pracy z narzędziami
  • RAG i wyszukiwanie wiedzy
  • Automatyzacje procesów i integracje
  • Produkcyjne wdrożenia i jakość
Evals
pomiar jakości odpowiedzi
Guardrails
kontrola ryzyka i kosztu
Integracje
CRM, Jira, bazy danych, API

Efekty

Typowe efekty wdrożeń

Redukcja pracy ręcznej

Automatyzacja powtarzalnych kroków i mniej operacji kopiuj-wklej.

Szybsze przygotowanie dokumentów

Oferty, podsumowania, raporty i checklisty generowane w standardzie.

Mniej błędów operacyjnych

Walidacje, audytowalność i spójność procesu.

Krótszy czas odpowiedzi

Asystenci RAG i workflowy wspierające zespoły w codziennej pracy.

Usługi

Agenci AI i automatyzacje procesów

Agenci AI do pracy z narzędziami

Agenci, którzy wykonują zadania wieloetapowe: planowanie, używanie narzędzi, weryfikacje i finalny raport.

  • Tool calling / function calling, workflowy wieloetapowe
  • Kontrola halucynacji: retrieval, cytowania, walidacje
  • Degradacja kontrolowana: fallbacki, tryby offline, manual review
RAG i wyszukiwanie wiedzy

Asystenci i agenci opierający się na firmowej wiedzy z dokumentów, intranetu i baz danych.

  • Pipeline: chunking, embeddings, vector DB, reranking
  • Uprawnienia i kontrola dostępu do danych
  • Evals jakości wyszukiwania i odpowiedzi
Automatyzacje procesów (backend + integracje)

Automatyzacje, które realnie zmniejszają koszty operacyjne i błędy, bez utraty kontroli nad procesem.

  • Integracje API: CRM, ERP, Jira, email, kalendarze
  • Kolejki i retry: niezawodność i odtwarzalność
  • Audytowalność: logi zdarzeń, wersjonowanie promptów
Produkcyjne wdrożenia i jakość

Zamieniam POC w produkcję - z testami, monitoringiem, SLA i przewidywalnym kosztem.

  • CI/CD, testy, code review, standardy jakości
  • Observability: tracing, metryki, alerting, dashboards
  • Polityki bezpieczeństwa: PII, redakcja, prompt injection defense

Case studies

NDA-friendly realizacje

Poniżej przedstawiam anonimizowane realizacje (w części kompozytowe) z projektów objętych NDA. Opisuję podejście architektoniczne, stos technologiczny i mierzalne efekty, bez ujawniania danych klienta.

Agent ofertowania i wycen

Zespół sprzedaży tracił czas na ręczne kompletowanie danych, wyliczenia i przygotowanie ofert w spójną formę.

Zaprojektowałam agenta, który prowadzi użytkownika przez wymagania, pobiera dane z kilku źródeł (CRM, cenniki, dokumentacja), wylicza warianty oraz generuje gotowy draft oferty z uzasadnieniem i listą ryzyk. Dodałam tryb human-in-the-loop dla newralgicznych fragmentów oraz walidacje zgodności z polityką cenową.

Python FastAPI Postgres SQLAlchemy Redis OpenAI/Azure OpenAI RAG Docker CI/CD

Krótszy czas przygotowania oferty, mniej błędów w kalkulacjach i spójniejszy standard materiałów.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: wdrożone

Asystent obsługi klienta z bazą wiedzy (RAG)

Duże obciążenie supportu przez powtarzalne pytania oraz rozproszone źródła wiedzy (PDF, wiki, procedury).

Zbudowałam pipeline RAG z kontrolą uprawnień oraz mechanizmem cytowania źródeł. Asystent odpowiada w oparciu o aktualne dokumenty, a w razie niskiej pewności automatycznie proponuje eskalację do człowieka. Dodałam ewaluacje jakości i monitoring halucynacji.

Python FastAPI embeddings vector DB Postgres OpenAI/Azure OpenAI Docker OpenTelemetry

Odciążenie pierwszej linii wsparcia, szybsze odpowiedzi i widoczność braków w dokumentacji.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: wdrożone

Agent analizy dokumentów i zgodności (compliance)

Ręczne przeglądanie umów i dokumentów było czasochłonne, a ryzyko pominięcia kluczowych zapisów wysokie.

Agent klasyfikuje dokument, wyciąga kluczowe klauzule, flaguje ryzyka i generuje checklistę do weryfikacji. Zastosowałam polityki PII, redakcję danych i walidacje wyników oraz eskalacje do człowieka tam, gdzie to konieczne.

Python FastAPI LLM ekstrakcja struktury Postgres storage CI/CD

Szybszy przegląd dokumentów, lepsza powtarzalność oceny i audytowalne logi.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: wdrożone

Automatyzacja back-office (workflowy + integracje)

Zespół operacyjny obsługiwał powtarzalne procesy w wielu narzędziach, co generowało opóźnienia i błędy.

Workflow zbiera dane z kilku systemów, waliduje je, aktualizuje rekordy i generuje podsumowanie. Dodałam kolejkowanie, retry i dead-letter queue oraz panel statusów. W newralgicznych krokach zastosowałam zatwierdzanie przez człowieka.

Python FastAPI kolejki zadań Postgres integracje API Docker

Mniej pracy ręcznej, mniej błędów i lepsza przewidywalność procesu.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: wdrożone

Agent planowania i priorytetyzacji zadań

Trudność z priorytetyzacją zadań i rozbijaniem tematów na wykonalne kroki w projektach wielowątkowych.

Agent zbiera kontekst, proponuje plan w formie backlogu oraz tworzy zadania w Jira wraz z acceptance criteria. Zastosowałam szablony i walidacje, aby utrzymać stały standard, oraz mechanizm feedbacku.

Python integracje Jira LLM Postgres observability

Szybsze planowanie, lepsza jakość ticketów i mniej chaosu w priorytetach.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: opcjonalnie

Agent do raportowania i analityki (LLM + data)

Raporty były ręcznie składane z różnych źródeł, a odpowiedzi na pytania biznesu zajmowały zbyt dużo czasu.

Bezpieczna warstwa do zadawania pytań o dane z kontrolą uprawnień. Agent generuje zapytania, uruchamia je i tłumaczy wyniki, z walidacjami, limitami kosztu i szablonami raportów.

Python SQL Postgres FastAPI LLM harmonogramy dashboards

Szybsze odpowiedzi, standard raportowania oraz kontrola kosztu i ryzyka.

  • Evals: wdrożone
  • Guardrails: wdrożone
  • Observability: wdrożone
  • Human-in-the-loop: opcjonalnie

Wizualizacje

Jak wygląda wdrożenie w praktyce

Wizualizacje pokazują typowy przebieg projektu i obszary, w których wdrożenia najczęściej przynoszą mierzalną wartość.

Pipeline RAG

Poniżej widzisz przykładowy przebieg pipeline RAG. Na desktopie tooltipy opisują kroki, a na mobile układają się pionowo.

  1. Źródła danych
  2. Ingestion
  3. Chunking
  4. Embeddings
  5. Vector DB
  6. Retrieval
  7. Reranking
  8. Odpowiedź z cytowaniami

Proces

Jak pracuję - od pomysłu do produkcji

Pracuję iteracyjnie. Zaczynam od celu biznesowego i ograniczeń (dane, bezpieczeństwo, narzędzia), a dopiero potem dobieram modele i architekturę. W każdym etapie dbam o to, żeby rozwiązanie było mierzalne, stabilne i możliwe do utrzymania.

Discovery i analiza potrzeb

Doprecyzowujemy use case, dane, ryzyka i kryteria sukcesu.

Architektura i plan wdrożenia

Dobór architektury, integracji, plan MVP i backlog.

MVP i szybki feedback

Szybka wersja działająca i iteracje na realnych scenariuszach.

Hardening i jakość

Guardrails, evals, testy, monitoring, kontrola kosztu i bezpieczeństwo.

Wdrożenie i rozwój

Stabilne wdrożenie, dokumentacja i dalsze iteracje.

Deliverables
  • Diagram architektury i przepływów
  • Specyfikacja MVP + backlog
  • Wersja produkcyjna (lub pilot) z monitoringiem
  • Zestaw testów i evals
  • Dokumentacja i instrukcja utrzymania

Stack

Tech stack

Backend
Python FastAPI REST API async background jobs kolejkowanie integracje
AI
OpenAI / Azure OpenAI prompt engineering tool calling RAG evals guardrails
Data
Postgres SQLAlchemy Redis vector DB (np. pgvector lub równoważne) pipeline danych
DevOps i jakość
Docker CI/CD testy (unit/integration) logging OpenTelemetry monitoring alerting

FAQ

Najczęstsze pytania

Czy można zobaczyć więcej szczegółów projektów?

Tak. Większość realizacji jest objęta NDA, ale mogę pokazać dodatkowe materiały po podpisaniu NDA lub w formie zanonimizowanych diagramów i przepływów.

Ile trwa MVP?

Najczęściej 1-3 tygodnie, zależy od danych i integracji. Wersja produkcyjna dojrzewa w kolejnych iteracjach.

Jak ograniczasz halucynacje?

RAG, walidacje, guardrails, evals na zestawie testowym oraz progi pewności i eskalacje do człowieka.

Jak kontrolujesz koszty LLM?

Limity, budżety per request, cache, dobieranie modeli do zadania, kompresja kontekstu.

Czy to działa po polsku?

Tak. Prompty i testy są projektowane pod język polski, a w razie potrzeby wdrażam wersję dwujęzyczną.

Jakie integracje są możliwe?

API systemów (CRM/ERP/Jira), Slack/Teams, email i kalendarze, bazy danych i źródła dokumentów.

Kontakt

Masz pomysł na agenta AI albo automatyzację procesu?

Opowiedz w 2-3 zdaniach, co chcesz usprawnić, a ja zaproponuję podejście, architekturę MVP i realny plan wdrożenia.