Компиляторы

Собеседование по компиляторам

Получить оффер в компиляторную команду Google, Apple или JetBrains - значит пройти собеседования где спросят: 'Почему dangling else неоднозначен?', 'Как escape analysis устраняет GC pressure?', 'Спроектируй JIT для embedded системы с 64MB RAM'. Эти вопросы не требуют знания всех компиляторов - они требуют понимания принципов и способности рассуждать о tradeoffs. Этот урок - синтез всего курса через призму реальных интервью.

**Apple compiler team** (Xcode/Metal/Swift) на design интервью спрашивает: 'Как реализовать incremental compilation для Swift?'. Ожидаемый ответ включает Salsa-like incremental computation и discussion о granularity трансформаций
**Google V8 team** спрашивает: 'Когда Turbofan деоптимизирует функцию и что происходит дальше?'. Senior ответ включает deoptimization materialization, OSR, и механизм повторной оптимизации
**Meta/Instagram PyTorch compiler team** спрашивает о torch.compile internals: dynamo tracing, AOT autograd, compiler backends. Ожидается знание основ MLIR и tradeoffs AOT vs JIT для ML inference

Вопросы по парсингу

На собеседованиях в компиляторные команды ожидают понимания парсинговых алгоритмов, их ограничений и применимости. LL(k) vs LR(k): LL - предсказывающий сверху-вниз, LR - снизу-вверх с lookahead. PEG грамматики детерминированы по определению. Practical: большинство современных компиляторов используют hand-written recursive descent.

JetBrains (создатели IntelliJ IDEA) на интервью для IDE team часто спрашивают об error recovery в парсерах и incremental parsing. Apple compiler team (clang/swift) - о LR vs LL и почему Swift выбрал recursive descent. Google compiler team - о LLVM pass scheduling и alias analysis.

Почему C++ нельзя корректно распарсить без семантической информации (symbol table)?

Вопросы по оптимизациям

Оптимизационные вопросы на собеседованиях проверяют понимание когда оптимизация применима и каков её реальный эффект. Важно знать: какую проблему решает оптимизация, при каких условиях она безопасна, как измерить её impact, и какие оптимизации LLVM применяет автоматически.

На собеседованиях в Google Brain (компиляторы для ML) спрашивают о loop transformations (tiling, interchange, fusion) и polyhedral model. Apple Silicon compiler team - о vectorization и SIMD. Cloudflare Workers team - о Wasm компиляции и security isolation через capability-based security.

Почему aggressive inlining может снизить производительность несмотря на устранение call overhead?

VM Design Questions

Вопросы о дизайне виртуальных машин проверяют системное мышление: как JVM, V8, CPython устроены, что это означает для производительности, и какие design decisions изменились бы сегодня. На senior позициях ожидают знание конкретных числе и компромиссов.

Netflix, LinkedIn, Twitter используют JVM в production с тонко настроенными GC параметрами: Kafka на ZGC (-XX:+UseZGC -Xmx16g), Elasticsearch на G1 (-XX:MaxGCPauseMillis=200). Понимание этих параметров ожидается на Senior Java/Scala позициях в этих компаниях.

Почему JVM escape analysis позволяет аллоцировать объекты на стеке?

Tradeoffs и System Design

Системные вопросы на senior+ позициях: как проектировать компилятор для конкретных требований. Нет правильного ответа - важно структурированное мышление: определить requirements, назвать tradeoffs, выбрать конкретный подход с обоснованием.

На компиляторных позициях в Apple (Xcode, Metal, LLVM), Google (V8, Go, XLA), Meta (HHVM, PyTorch compiler), JetBrains (IntelliJ Kotlin compiler) процесс: 1-2 coding rounds (LeetCode medium/hard), 2-3 design rounds (компиляторные и системные), 1 values/culture round. Design rounds - ключевые: надо показать понимание real-world tradeoffs а не только академическое знание.

На компиляторном собеседовании нужно знать всё - от лексера до регистрового аллоктора

Важнее глубина в нескольких областях и понимание tradeoffs, чем поверхностное знание всего. Интервьюеры ищут инженерное мышление: 'почему' важнее 'что'

Специализация нормальна: engineer в JIT team может не знать деталей parser. Engineer в GC team не обязан знать instruction selection. Но все должны понимать как компоненты взаимодействуют и какие tradeoffs сделаны в их системе

На вопросе о проектировании компилятора с чего начать структурированный ответ?

Итоги

Parsing questions: C++ требует semantic info для парсинга; PEG детерминирован (нет ambiguity) vs CFG; dangling else - классический ambiguity
Optimization questions: знать условия применимости (alias analysis для SIMD, escape для stack alloc) и когда оптимизация вредит (inlining code bloat)
System design: начинать с requirements/constraints; структурировать ответ как tradeoffs а не как список технологий; глубина в нескольких областях важнее ширины

Связанные темы

Это финальный урок курса - синтез всех компиляторных концепций:

JIT-компиляция основы — Tiered compilation (V8 Ignition/Sparkplug/Maglev/Turbofan) - ключевая тема VM design questions
Продвинутый GC — ZGC, Shenandoah, write barriers - типичные вопросы о VM design на senior позициях
LLVM инфраструктура — LLVM IR, passes, ThinLTO - базовые знания для compiler team позиций в Apple/Google/ARM

Вопросы для размышления

Какой раздел компиляторного курса оказался наиболее неожиданным или противоречащим первоначальным ожиданиям? Почему?
Если бы нужно было выбрать один компиляторный проект для глубокого изучения (rustc, V8, GCC, LLVM, CPython) - какой и почему? Что это говорит о профессиональных интересах?
Compiler engineer vs regular software engineer: какие навыки фундаментально отличаются? В каких продуктовых командах знание компиляторов даёт незакономерное преимущество?

Связанные уроки

fl-01-intro