Merlin Research

non-profit

AI & ML interests

Independent AI safety lab. Stockholm, Sweden. We test deployed LLM agents under adversarial conditions and measure behavioral alignment in production — not in controlled benchmarks.

Recent Activity

squ11z1 updated a dataset about 1 month ago

MerlinSafety/EuroAlign-1K

squ11z1 published a model about 1 month ago

MerlinSafety/Pluto

squ11z1 updated a model about 1 month ago

MerlinSafety/Pluto

View all activity

Organization Card

Community About org cards

Merlin Research

Merlin Research is an independent AI safety and reasoning research organization focused on building practical, auditable, and robust open models.

Mission

We develop and evaluate models that are:

Strong in constrained instruction-following
Safer in real-world agentic workflows
Better aligned under uncertainty and adversarial prompts
Transparent in behavior, limits, and deployment risks

What We Build

Safety-oriented reasoning models
Alignment-focused post-training pipelines
Evaluation suites for robustness, controllability, and failure analysis
Open artifacts for reproducible research

Current Focus Areas

Safety reasoning for small/efficient LLMs
Misalignment reduction via structured post-training
Hallucination risk reduction in high-stakes contexts
Robust instruction adherence with explicit constraints

Research Principles

Measure behavior, not marketing claims.
Prioritize reproducibility and clear documentation.
Publish limitations, not only strengths.
Design for safe deployment from day one.

Models

Our flagship releases are published under this organization with:

Full model cards
Clear training/deployment notes
Practical usage guidance

Collaboration

We welcome collaboration on:

AI safety evaluation
Alignment methods
Reasoning benchmarks
Responsible open model deployment

For partnerships or research collaboration, contact us via Hugging Face discussions or linked channels in our repositories.

Merlin Research
Safe reasoning. Measurable alignment. Real-world robustness.

models 3

MerlinSafety/Pluto

Image-Text-to-Text • 9B • Updated Mar 22 • 473 • 4

MerlinSafety/HybridIntelligence-0.5B

Text Generation • 0.5B • Updated Mar 14 • 14 • 6

Merlin Research

AI & ML interests

Recent Activity

Merlin Research

Mission

What We Build

Current Focus Areas

Research Principles

Models

Collaboration

models 3

MerlinSafety/Pluto

MerlinSafety/HybridIntelligence-0.5B

MerlinSafety/Qwen3.5-4B-Safety-Thinking

datasets 1

MerlinSafety/EuroAlign-1K

AI & ML interests

Recent Activity

Team members 2

Merlin Research

Mission

What We Build

Current Focus Areas

Research Principles

Models

Collaboration

models 3 Sort: Recently updated

datasets 1

models 3