Modele LLM (Large Language Models), aplikacje RAG (Retrieval-Augmented Generation) oraz rozwiązania AI wspierające analizę danych, dokumentów i procesów biznesowych stają się realnym standardem nowoczesnych organizacji.
Problem polega jednak na tym, że większość materiałów dostępnych w Internecie pokazuje wyłącznie proste demonstracje lub „zabawę promptami”. W środowisku enterprise to zdecydowanie za mało.
Co otrzymujesz po warsztatach:
- 2 gotowe aplikacje RAG klasy enterprise
- pełny pipeline przetwarzania dokumentów
- architekturę gotową do wdrożenia w Twojej firmie
- bazę pod dalszą automatyzację procesów
Realnie budujesz:
1. System wyszukiwania dokumentów (bank-grade)
- Full-Text Search + wektory
- wyszukiwanie semantyczne
- obsługa dużych zbiorów dokumentów
2. System RAG (Retrieval-Augmented Generation)
- pipeline produkcyjny
- chunking, embeddingi, indeksowanie
- generowanie odpowiedzi na podstawie danych firmowych
3. AI Agent (pracownik cyfrowy)
- integracja z bazą danych (SQL Server)
- automatyzacja zapytań
- wsparcie decyzji biznesowych
Prowadzący: Andrzej Śmigielski
1. OMÓWIENIE STACKU TECHNOLOGICZNEGO
- Środowisko warsztatowe - Core
- Alternatywne technologie enterprise
- Podsumowanie i uzasadnienie stacku technologicznego
2. INSTALACJA WYMAGANEGO ŚRODOWISKA
- Wymagania sprzętowe
- Instalacja oprogramowania + doinstalowanie wymaganych składników
- Graficzny schemat działania modelu
3. CASE: SYSTEM WYSZUKIWANIA DOKUMENTÓW W BANKU
- Wprowadzenie do systemu
- Scenariusz biznesowy
- Zakres dokumentów
- Problem wyszukiwania dokumentów
- Architektura rozwiązania
- Model danych
4. UTWORZENIE BAZY DANYCH, DBO, FTS I OMÓWIENIE DOKUMENTÓW
- Utworzenie bazy danych i DBO
- FTS (Full-Text Search)
- Omówienie dokumentów pdf
- Przygotowanie DBO dla dokumentów
- Docelowy proces wyszukiwania
- Załadowanie testowych dokumentów
EMBEDDINGI, WEKTORY, METODY
- Wprowadzenie
- Reprezentacja tekstu jako wektor
- Przestrzeń wektorowa
- Podobieństwo wektorów
- Metoda cosine similarity (podobieństwo cosinusowe)
- Wyprowadzenie matematyczne
- Przykład obliczenia podobieństwa cosinusowego
- Normalizacja L2
- ANN - Approximate Nearest Neighbor (przybliżony najbliższy sąsiad)
- Ręczne obliczenie podobieństwa cosinusowego
- Implementacja cosine similarity w T-SQL
- Implementacja cosine similarity w .NET C# (CLR)
- Case: test wydajnościowy - SQL vs .NET C#
BUDOWA PIPELINE (PROCES)
- Wprowadzenie do pipeline (proces)
- Architektura pipeline (proces)
- Cel dzielenia dokumentów na fragmenty
- Czym jest chunk
- Sliding window
- Overlap
- Granularność chunków
- Strategia segmentacji regulacji prawnych
- Implementacja chunkingu w .NET C#
- Model embeddingów i ich uzasadnienie
- Implementacja embeddingów w .NET C#
GOTOWY PROJEKT RAG W C#
- Wstęp dotyczący podejścia
- Implementacja aplikacji RAG w C#
CZYSZCZENIE / AKTUALIZACJA DOKUMENTÓW
- Wprowadzenie
- Implementacja procedury
- Podpięcie procedury do aplikacji
CASE: WYSZUKIWANIE SEMANTYCZNE (HYBRID)
- Wprowadzenie do sposobów wyszukiwania
- Architektura pipeline (proces) systemu RAG
- Model llama3
- Implementacja pipeline RAG (hybrid)
- Case: lista wymaganych dokumentów (pl)
CASE: UŻYCIE SEMANTIC KERNEL (.NET)
- Wstęp
- Semantic kernel (.NET) + orkiestracja
- Implementacja docelowa RAG + orkiestracja
- Podsumowanie
- Agent AI do SQL (plugin) v1
- Agent AI do SQL (plugin) v2
PROBLEM SKALOWANIA W SYSTEMACH RAG
- Wstęp
- Brute-force similarity = o(n)
- Wąskie gardła, tzw. Bottlenecks
- Dlaczego 10k działa a 1m nie
- Case: pomiar czasu
- Case: ile ram zajmuje baza embeddingów
- Case: test realny w projekcie C#
ANN, HNSW, IVF, FAISS: PRZYŚPIESZENIE 100-1000X
- ANN (Approximate Nearest Neighbor)
- HNSW (Hierarchical Navigable Small World)
- IVF (Inverted File Index)
- HNSW vs. IVF
- biblioteka FAISS vs. Vector DB
INSTALACJA FAISS
- Wstęp
- Instalacja Python
- Środowisko wirtualne venv
- Instalacja FAISS
- Weryfikacja instalacji FAISS
- Podsumowanie
RAG: POZIOM ENTERPRISE - IMPLEMENTACJA
- Schemat finalny rozwiązania klasy enterprise
- Budowa API FAISS (flask)
- Integracja z C# (nasz projekt)
- Testowanie
- Podsumowanie
ROZSZERZENIA KLASY ENTERPRISE W SYSTEMIE RAG
- Rate limiting - ograniczenia szybkości
- Guardrails - bariery ochronne
- Analiza BIAS
- Wykrywaniem outlierów - wartości odstające
- Testy regresji modelu
- Podsumowanie modułu