肖有为

self_at_fuzhou.jpg

Youwei Xiao 肖有为

北京大学集成电路学院

北京,中国

我是北京大学集成电路学院博士研究生,导师为 梁云 教授;2022 年于北京大学获得电子信息科学与技术学士学位。我的研究围绕敏捷芯片设计与编译优化的软硬件协同展开:从真实软件负载中发现架构定制机会,将定制能力综合为可实现的硬件,并通过编译器与系统软件让这些能力服务于实际应用。

我的第一条工作线关注 硬件综合。我构建面向 EDA 的软件抽象,将高层设计意图连接到高效 RTL 级硬件实现,包括高层次综合框架 Hector(ICCAD 2022)、Rust 硬件描述语言 Cement(FPGA 2024),以及 SkyEgg 中基于 e-graph 的综合优化。围绕这些工作,我使用 MLIR、Rust 与编译器 IR 设计,让硬件综合过程更可编程、可分析、可优化。

第二条工作线关注 架构定制。我探索如何用编译分析、应用画像、设计空间搜索和形式化方法,自动发现有价值的加速器与自定义指令。Cayman(DAC 2025)在考虑控制流与数据访问策略的同时生成领域专用加速器;ISAMORE(ASPLOS 2026)使用 e-graph 反合一从等价程序片段中发现可复用的自定义指令。

这两条线共同指向更完整的协同设计目标:从敏捷规格甚至目标应用出发,自动推导架构设计、硬件实现与编译器支持。我与实验室同学共同发起并推进 APS 项目,希望以尽可能少的人工介入,为目标机器学习模型生成优化的 ML ASIC 方案并配套完整 ML 编译支持。我也参与组织 EDA 与体系结构会议教程,介绍敏捷硬件专用化和软硬件协同设计方法,相关材料见 APS tutorials

近期,我将这一研究议程推进到 LLM 时代的编译器与系统技术。一方面,我研究 LLM 与智能体如何成为编译优化和软硬件协同设计的新接口,包括用于等式饱和策略综合的 EggMind,以及面向下一代 APS 和 Spine 的智能体协同设计流程。另一方面,我研究面向新兴机器学习负载的编译器与运行时系统,包括 IntelliC 中面向人与智能体协作的可检查编译表示,PTO Runtime 中面向 Ascend 芯片与灵衢 SuperPod 的分布式服务任务图执行,以及 Hive 中面向多智能体系统推理的编程界面和控制层基础设施。

动态

2026年5月28日 获评 2026-2027 学年 博士研究生校长奖学金,集成电路学院共有 10 人入选。
2026年5月9日 获评北京大学集成电路学院 2026 年度 学术之芯,该荣誉共授予 8 人。
2026年3月31日 ISAMORE 获得 ASPLOS 2026 Best Paper Award5/1048)。

代表性论文

  1. Preprint
    LLM-Guided Strategy Synthesis for Scalable Equality Saturation
    Chenyun Yin*Youwei Xiao*, Yuze Luo, and 2 more authors
    2026
  2. Preprint
    Hive: A Multi-Agent Infrastructure for Algorithm- and Task-Level Scaling
    Zizhang Luo, Yuhao Luo, Youwei Xiao, and 3 more authors
    2026
  3. Arch 2.0
    EggMind: LLM-Driven Two-Dimensional Intelligence for Scalable Equality Saturation
    Youwei Xiao, Chenyun Yin, and Yun Liang
    In Architecture 2.0: Workshop on AI for Computing Systems Design, 2026
  4. ASPLOS
    Finding Reusable Instructions via E-Graph Anti-Unification
    Youwei Xiao, Chenyun Yin, Yitian Sun, and 2 more authors
    In Proceedings of the 31st ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2 (ASPLOS ’26), 2026
    Best Paper Award at ASPLOS 2026 (5/1048 submissions).
  5. Preprint
    Aquas: Enhancing Domain Specialization through Holistic Hardware-Software Co-Optimization based on MLIR
    Yuyang Zou, Youwei Xiao, Yansong Xu, and 6 more authors
    2025
  6. Preprint
    SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs
    Youwei Xiao, Yuyang Zou, and Yun Liang
    2025
  7. Preprint
    Cement2: Temporal Hardware Transactions for High-Level and Efficient FPGA Programming
    Youwei Xiao, Zizhang Luo, Weijie Peng, and 2 more authors
    2025
  8. ICCAD
    Invited Paper: APS: Open-Source Hardware-Software Co-Design Framework for Agile Processor Specialization
    Youwei Xiao, Yuyang Zou, Yansong Xu, and 6 more authors
    In Proceedings of the 44rd IEEE/ACM International Conference on Computer-Aided Design (ICCAD ’25), 2025
  9. ICCAD
    Clay: High-level ASIP Framework for Flexible Microarchitecture-Aware Instruction Customization
    Weijie Peng*Youwei Xiao*, Yuyang Zou, and 2 more authors
    In Proceedings of the 44rd IEEE/ACM International Conference on Computer-Aided Design (ICCAD ’25), 2025
  10. DAC
    Cayman: Custom Accelerator Generation with Control Flow and Data Access Optimization
    Youwei Xiao, Fan Cui, Zizhang Luo, and 2 more authors
    In Proceedings of the 62nd ACM/IEEE Design Automation Conference (DAC ’25), 2025
  11. LATTE
    cmt2: Rule-Based Hardware Description in Rust with Temporal Semantics
    Youwei Xiao, Zizhang Luo, and Yun Liang
    In 5th Workshop on Languages, Tools, and Techniques for Accelerator Design (LATTE’25), 2025
  12. FPGA
    An Empirical Comparison of LLM-based Hardware Design and High-level Synthesis
    Fan Cui, Youwei Xiao, Kexing Zhou, and 1 more author
    In Proceedings of the 2025 ACM/SIGDA International Symposium on Field Programmable Gate Arrays (FPGA ’25), 2025
  13. FPGA
    Cement: Streamlining FPGA Hardware Design with Cycle-Deterministic eHDL and Synthesis
    Youwei Xiao, Zizhang Luo, Kexing Zhou, and 1 more author
    In Proceedings of the 2024 ACM/SIGDA International Symposium on Field Programmable Gate Arrays (FPGA ’24), 2024
  14. ICCAD
    HECTOR: A Multi-Level Intermediate Representation for Hardware Synthesis Methodologies
    Ruifan Xu, Youwei Xiao, Jin Luo, and 1 more author
    In Proceedings of the 41st IEEE/ACM International Conference on Computer-Aided Design (ICCAD ’22), 2022