About Michael
- Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
- Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
- Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
- RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.
- Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
- Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
- Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.
- Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
- Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
- CI/CD: GitLab CI, GitHub Actions, CMake, Make.
- Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.
- Anforderungsanalyse, Mentoring.
- Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).
German
Native or bilingual
English
Fluent
Experience
- Internal R&DLLM Inferenz-Optimierung & Fine-TuningDecember 2025 - January 2026 (1 month)- Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.- Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).- Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).- Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo
- Proof of Concept (PoC)Deployment eines lokalen LLMs (Edge AI)December 2025 - January 2026 (1 month)- Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).- Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.- Integration: Anbindung an Open WebUI via API als Drop-In Replacement.- Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp
- Proof of Concept (PoC)Automatisierung KundenbestellungenDecember 2025 - January 2026 (1 month)- Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.- Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).- Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker
Recommendations
Be the first to recommend Michael
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- M.Sc. Robotics, Cognition, IntelligenceTechnische Universität München2018Vereint interdisziplinäre Kenntnisse aus den Bereichen Robotik, künstliche Intelligenz, Maschinelles Lernen und Kognitive Systeme. Ziel ist es, intelligente, autonome Systeme zu verstehen und zu entwickeln.