Компиляторы

GraalVM и Truffle

Что если JIT-компилятор написан на Java и компилирует сам себя? Graal именно так и работает. А что если интерпретатор Python, написанный на Java с несколькими аннотациями, автоматически получает JIT-компиляцию через partial evaluation - без написания отдельного компилятора? Это Truffle. GraalVM - это не просто 'ещё одна JVM', это платформа, где язык = интерпретатор + аннотации, и компилятор получается бесплатно.

**Quarkus + Native Image** в Red Hat OpenShift: микросервисы стартуют за 12ms и потребляют 35MB RAM - это делает Java конкурентоспособным с Go для serverless workloads
**Oracle Database MLE**: JavaScript-функции вызываются прямо внутри SQL через GraalVM Polyglot - без round-trip к внешнему сервису
**TruffleRuby** в production у Shopify (2022): select Ruby on Rails endpoints переведены на TruffleRuby с 30-40% снижением latency на числовых операциях

Partial Evaluation в Graal

Graal compiler - это JIT-компилятор написанный на Java, работающий внутри JVM. Вместо C++ (как HotSpot C2), Graal использует Java с аннотациями. Ключевая идея Truffle: partial evaluation (PE) применяется к интерпретатору языка. Если интерпретатор AST написан с аннотациями `@ExplodeLoop`, `@Specialization`, PE раскрывает его в специализированный нативный код для конкретной программы.

Результат PE через Graal: TruffleRuby, GraalPython, FastR (R), Sulong (LLVM IR) достигают в peak throughput 80-95% от скорости Java для числовых задач. Это первая система, где новый язык получает JIT-компилятор просто написав интерпретатор с Truffle-аннотациями.

Что делает Graal Partial Evaluation с Truffle-интерпретатором?

Self-Optimizing AST Interpreters

Self-optimizing AST - техника Truffle, где узлы AST сами переписывают себя при выполнении. Начинается с generic узла (UninitializedAddNode), при первом вызове с двумя int - узел заменяет себя на IntAddNode. При появлении double - снова заменяет. Это inline замена узлов без перекомпиляции всего AST.

TruffleRuby (Oracle) в 2023 году обогнал JRuby по производительности на большинстве числовых бенчмарков и достиг 2-3x ускорения против MRI Ruby. FastR обгоняет GNU R в 20-30x для матричных операций. Это результат PE + self-optimizing AST без написания специализированного компилятора для каждого языка.

В чём ключевое отличие self-optimizing AST от традиционного интерпретатора?

Polyglot Runtime

GraalVM Polyglot API позволяет вызывать код на разных языках в одном процессе без сериализации. Java вызывает Python-функцию, Python использует JavaScript объект, JavaScript вызывает R для статистики - всё в общей памяти. Каждый язык реализован как Truffle language и разделяет одну JVM heap.

Oracle использует GraalVM в продакшне для Oracle Database Multilingual Engine (MLE) - SQL-запросы могут вызывать JavaScript-функции прямо внутри базы. Cloudflare Workers рассматривал GraalVM как альтернативу V8 для edge computing. Основное ограничение: JVM startup time ~100ms несовместим с cold-start требованиями serverless.

Как GraalVM Polyglot API передаёт данные между Python и JavaScript кодом?

GraalVM Native Image

Native Image - AOT (Ahead-of-Time) компилятор GraalVM, превращающий Java-приложение в нативный бинарник без JVM. Анализ замкнутого мира (closed-world assumption): все классы известны до компиляции, рефлексия ограничена конфигурацией. Результат: startup ~10ms вместо ~500ms JVM, RSS ~50MB вместо ~300MB.

Quarkus (Red Hat) и Micronaut построены для Native Image с нуля: dependency injection разрешается в compile time, а не в runtime. AWS Lambda с Quarkus Native показывает cold start <50ms против 2-5 секунд для Spring Boot JVM. В 2024 GraalVM Community Edition включён в GDK (Graal Development Kit) и доступен в Amazon Corretto.

GraalVM Native Image всегда быстрее JVM-версии того же приложения

Native Image быстрее стартует и потребляет меньше памяти, но peak throughput часто ниже из-за отсутствия JIT-оптимизаций

JIT адаптируется к реальной нагрузке и применяет спекулятивные оптимизации. AOT-код генерируется без знания рантайм-профиля. Для долгоживущих серверов JVM-версия с прогревом обычно быстрее; для serverless/CLI - Native Image выигрывает на старте

Что такое 'closed-world assumption' в контексте Native Image?

Итоги

Graal compiler написан на Java и использует partial evaluation: Truffle-интерпретатор специализируется под конкретную программу, генерируя нативный код без написания отдельного компилятора
Self-optimizing AST: узлы переписывают себя при выполнении, адаптируясь к реальным типам - это база для TruffleRuby, GraalPython, FastR
Native Image компилирует Java AOT в нативный бинарник: startup 10-50ms вместо 500ms JVM, но без JIT-оптимизаций в рантайме

Связанные темы

GraalVM объединяет несколько компиляторных концепций:

JIT-компиляция основы — Graal заменяет C2 (HotSpot) как JIT backend; использует те же принципы но написан на Java
Спекулятивные оптимизации — Partial Escape Analysis в Graal - продвинутая спекулятивная оптимизация для аллокаций
LLVM — Sulong (Truffle LLVM) позволяет запускать LLVM IR (C/C++/Rust) через Truffle как гостевой язык

Вопросы для размышления

Graal написан на Java и компилирует Java - это bootstrapping проблема или нет? Как GraalVM обходит зависимость от себя?
Closed-world assumption Native Image конфликтует с популярными Java фреймворками (Spring, Hibernate) использующими рефлексию. Как фреймворки адаптировались?
TruffleRuby достигает 80% скорости Java для числового кода. Для чего Ruby всё равно медленнее Java даже с Truffle?

Связанные уроки

ml-01-intro