You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Michael WagnerMW

Michael Wagner

Edge AI Engineer | Generative AI & Embedded System

€960/day
München, DE
3-7 years

Average response time: 1 hour

About Michael

Edge AI Engineer | Generative AI & Embedded Systems

Spezialist für Edge AI & High-Performance Inferenz. Ich verbinde 6 Jahre Embedded-Erfahrung (C, Robotik) mit tiefem Know-how in Generative AI (LLM-Optimierung, Agents). Ich sorge dafür, dass moderne KI-Modelle auch außerhalb der Cloud performant und zuverlässig laufen.

Schwerpunkte: Generative AI (LLMs, Agents), Edge AI / On-Device Inference, Embedded Software Engineering, Robotics & Sensor Fusion.


Generative AI & LLM Engineering:
  • Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
  • Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
  • Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
  • RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.


Embedded Systems & C/C++:
  • Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
  • Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
  • Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.


Software Architecture & DevOps:
  • Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
  • Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
  • CI/CD: GitLab CI, GitHub Actions, CMake, Make.
  • Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.


Methoden & Soft Skills:
  • Anforderungsanalyse, Mentoring.
  • Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).
  • German

    Native or bilingual

  • English

    Fluent

Can work on-site
München (up to 50km)

Experience

  • Internal R&D
    LLM Inferenz-Optimierung & Fine-Tuning
    December 2025 - January 2026 (1 month)
    - Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.
    - Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).
    - Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).
    - Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo
    Python vllm Hugging Face Kubernetes NVIDIA Dynamo
  • Proof of Concept (PoC)
    Deployment eines lokalen LLMs (Edge AI)
    December 2025 - January 2026 (1 month)
    - Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).
    - Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.
    - Integration: Anbindung an Open WebUI via API als Drop-In Replacement.
    - Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp
    Python llama.cpp Docker Quantization GGUF
  • Proof of Concept (PoC)
    Automatisierung Kundenbestellungen
    December 2025 - January 2026 (1 month)
    - Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.
    - Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).
    - Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker
    Python Camunda Docker PostgreSQL

Recommendations

Be the first to recommend Michael

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • M.Sc. Robotics, Cognition, Intelligence
    Technische Universität München
    2018
    Vereint interdisziplinäre Kenntnisse aus den Bereichen Robotik, künstliche Intelligenz, Maschinelles Lernen und Kognitive Systeme. Ziel ist es, intelligente, autonome Systeme zu verstehen und zu entwickeln.

Skill set

Categories