Actively Employing 26 Fall Masters, and PhDs

I am actively recruiting 26 Fall PhD students and Postdoc/RA/Visiting Students. If you are looking for research positions, please do not hesitate to contact me via email: yanglinyiucd[at]gmail[dot]com

Previously, I was fortunate to be supervised by Prof. Jun Wang (UCL), Prof. Barry Smyth (UCL), and Prof. Yue Zhang (Westlake). My research interests are building AI co-scientists, enhancing LLMs’ reasoning capabilities, and designing open-ended curiosity-driven exploration-based methods. I served as an Area Chair at ICLR, ACL, EMNLP, and CIKM, a Senior Program Committee member at IJCAI, and an Associate Editor at the Special Issue on TIST with Prof. Jindong Wang and Prof. Qiang Yang.

I have published more than 40 papers at top-tier conferences, such as ICLR, NeurIPS, ACL, AAAI, EMNLP, and WWW, including 11 co-leading Core A* (CCF-A) papers with a total citation: .

🏆 Honors and Awards

Area Chair: ICLR 2025; ACL 2024-2025; EMNLP 2023; IJCAI 2023 (SPC); CIKM 2022; Associate Editor: TIST.
Outstanding Postdoctoral Representative, 2023.
Outstanding Postdoc Researcher, 2022.
Outstanding Self-financed Students Abroad (Special Awards, Only 1 Winner in Ireland, 50 Winners in total), 2021.
Best Paper Candidate, CCIS, 2018.

Team Members

Research Assistants:

Huichi Zhou (Impirical College London)

Qi Zhang (Oxford University)

Zihan Wang (Tsinghua University (Shenzhen))

Lam Nguyen (Tsinghua University (Shenzhen))

🌱 Repository

[ AgentFly | OpenR | CycleResearcher | LLM-Eval ]

⚡ GenAI Lab News

2025-Sep Two papers have been accepted to EMNLP 2025, including an oral paper (ResearStudio).
2025-Jan Six papers have been accepted to the main conference of ICLR 2025, including an oral paper.
2024-Dec I served as an Area Chair at ACL 2025 and ICLR 2025.
2024-Nov We gave the tutorial on LLM Evaluation at AAAI 2024 and CVPR 2025.
2024-Oct I have been invited to give a 6-hour tutorial at RL China 2024.
2024-May Two papers have been accepted to the main conference of ACL 2024.
2024-Feb One paper has been accepted to NAACL 2024 (Rationale-centric Counterfactual Data Augmentation).
2024-Jan Three papers (SuperContext, FastDetect, and PandaLM) have been accepted to ICLR 2024.
2023-Dec One paper has been accepted to EMNLP 2023.
2023-Nov Organized ACM TIST Special Issue on Evaluations of Large Language Model with Dr. Jindong Wang and Prof. Qiang Yang.
2023-May Four papers have been accepted to ACL 2023 (Three leading author papers).
2023-Apr Our paper discussing the robustness of ChatGPT has been accepted to ICLR 2023 Workshop.
Area Chair / Senior Programme Committee (SPC): EMNLP-22; CIKM-22; IJCAI-23; ACL-25.
PC Member/Reviewer: CIKM-20; SIGIR-21; CKIM-21; EMNLP 2021-2024; ACL 2021-2024; COLING 2022-2024; TASLP; TALLIP; TBD; TKDE.

📝 Publications

* denotes equal contribution + denotes corresponding author

(45) Constrain Alignment with Sparse Autoencoders

Qingyu Yin, Chak Tou Leong, Hongbo Zhang, Minjun Zhu, Hanqi Yan, Qiang Zhang, Yulan He, Wenjie Li, Jun Wang, Yue Zhang, Linyi Yang

Forty-Second International Conference on Machine Learning (``ICML 2025, CCF-A``).
(44) DeepReview: Improving LLM-based Paper Review with Human-like Deep Thinking Process

Minjun Zhu, Yixuan Weng, Linyi Yang, Yue Zhang

The 62nd Annual Meeting of the Association for Computational Linguistics (``ACL 2025, CCF-A``).
(43) Pre-Training a Graph Recurrent Network for Text Understanding

Yile Wang, Linyi Yang, Zhiyang Teng, Ming Zhou, Yue Zhang

IEEE Transactions on Pattern Analysis and Machine Intelligence 2025 (``TPAMI, CCF-A``).
(42) An Empirical Analysis of Uncertainty in Large Language Model Evaluations.

Qiujie Xie, Qingqiu Li, Zhuohao Yu, Yuejie Zhang, Yue Zhang, Linyi Yang+.

International Conference on Learning Representations 2025 (``ICLR 2025, Tsinghua-A``).
(41) CycleResearcher: Improving Automated Research via Automated Review.

Yixuan Weng, Minjun Zhu, Guangsheng Bao, Hongbo Zhang, Jindong Wang, Yue Zhang+, Linyi Yang+.

International Conference on Learning Representations 2025 (``ICLR 2025, Tsinghua-A``).
(40) Personality Alignment of Large Language Models.

Minjun Zhu, Yixuan Weng, Linyi Yang, Yue Zhang.

International Conference on Learning Representations 2025 (``ICLR 2025, Tsinghua-A``).
(39) MMQA: Evaluating LLMs with Multi-Table Multi-Hop Complex Questions.

Jian Wu, Linyi Yang, Dongyuan Li, Yuliang Ji, Manabu Okumura, Yue Zhang.

International Conference on Learning Representations 2025 (average score: 8, top 20) (``ICLR 2025, Tsinghua-A``).
(38) CofCA: A STEP-WISE Counterfactual Multi-hop QA benchmark.

Jian Wu, Linyi Yang, Zhen Wang, Manabu Okumura, Yue Zhang.

International Conference on Learning Representations 2025 (``ICLR 2025, Tsinghua-A``).
(37) Human Simulacra: Benchmarking the Personification of Large Language Models.

Qiujie Xie, Qiming Feng, Tianqi Zhang, Qingqiu Li, Linyi Yang, Yuejie Zhang, Rui Feng, Liang He, Shang Gao, Yue Zhang.

International Conference on Learning Representations 2025 (``ICLR 2025, Tsinghua-A``).
(36) PromptBench: Towards Evaluating the Robustness of Large Language Models on Adversarial Prompts. [paper];

Kaijie Zhu, Jindong Wang, Jiaheng Zhou, Zichen Wang, Hao Chen, Yidong Wang, Linyi Yang, Wei Ye, Neil Zhenqiang Gong, Yue Zhang, Xing Xie.

1st ACM Workshop on Large AI Systems and Models with Privacy and Safety Analysis (``CCS Workshop``).
(35) Detoxifying Large Language Models via Knowledge Editing. [paper]

Mengru Wang, Ningyu Zhang, Ziwen Xu, Zekun Xi, Shumin Deng, Yunzhi Yao, Qishen Zhang, Linyi Yang, Jindong Wang, Huajun Chen.

The 62nd Annual Meeting of the Association for Computational Linguistics (``ACL 2024, CCF-A``).
(34) Deepfake text detection in the wild. [paper]

Yafu Li, Qintong Li, Leyang Cui, Wei Bi, Longyue Wang, Linyi Yang, Shuming Shi, Yue Zhang.

The 62nd Annual Meeting of the Association for Computational Linguistics (``ACL 2024, CCF-A``).
(33) A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution. [paper]

Bowen Ding, Qingkai Min, Shengkun Ma, Yingjie Li, Linyi Yang†, Yue Zhang.

Annual Conference of the North American Chapter of the Association for Computational Linguistics 2024 (``NAACL 2024``).
(32) PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization. [paper];

Yidong Wang, Zhuohao Yu, Zhengran Zeng, Linyi Yang, Cunxiang Wang, Hao Chen, Chaoya Jiang, Rui Xie, Jindong Wang, Xing Xie, Wei Ye, Shikun Zhang, Yue Zhang.

International Conference on Learning Representations 2024 (``ICLR 2024, Tsinghua-A``).
(31) Supervised Knowledge Makes Large Language Models Better In-context Learners. [paper]

Linyi Yang, Shuibai Zhang, Zhuohao Yu, Guangsheng Bao, Yidong Wang, Jindong Wang, Ruochen Xu, Wei Ye, Xing Xie, Weizhu Chen, Yue Zhang.

International Conference on Learning Representations 2024 (``ICLR 2024, Tsinghua-A``).
(30) Fast-DetectGPT: Efficient zero-shot detection of machine-generated text via conditional probability curvature. [paper]

Guangsheng Bao, Yanbin Zhao, Zhiyang Teng, Linyi Yang, Yue Zhang.

International Conference on Learning Representations 2024 (``ICLR 2024, Tsinghua-A``).
(29) LLMs with Chain-of-Thought Are Non-Causal Reasoners. [paper]

Guangsheng Bao, Hongbo Zhang, Linyi Yang, Cunxiang Wang, Yue Zhang.

arXiv preprint 2024 (``COLING 2024 (Oral)``).
(28) A Survey on Evaluation of Large Language Models. [paper];

Yupeng Chang, Xu Wang, Jindong Wang, Yuan Wu, Kaijie Zhu, Hao Chen, Linyi Yang, Xiaoyuan Yi, Cunxiang Wang, Yidong Wang, Wei Ye, Yue Zhang, Yi Chang, Philip S. Yu, Qiang Yang, Xing Xie.

Transactions on Intelligent Systems and Technology (``TIST 2024``).
(27) Out-of-Distribution Generalization in Natural Language Processing: Past, Present, and Future. [paper]

Linyi Yang, Yaoxian Song, Xuan Ren, Chenyang Lyu, Yidong Wang, Jingming Zhuo, Lingqiao Liu, Jindong Wang, Jennifer Foster, Yue Zhang.

The 2023 Conference on Empirical Methods in Natural Language Processing (``EMNLP 2023``).
(26) Measuring Consistency in Text-based Financial Forecasting Models. [paper]

Linyi Yang,Yingpeng Ma, Yue Zhang.

The 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (``ACL 2023 (Oral)``).
(25) GLUE-X: Evaluating Natural Language Understanding Models from an Out-of-distribution Generalization Perspective. [paper];

Linyi Yang, Shuibai Zhang, Libo Qin, Yafu Li, Yidong Wang, Hanmeng Liu, Jindong Wang, Xing Xie, Yue Zhang.

Findings of the Association for Computational Linguistics: ACL 2023 (``ACL 2023, CCF-A``).
(24) Learning to Generalize for Cross-domain QA. [paper]

Yingjie Niu, Linyi Yang, Ruihai Dong, Yue Zhang.

Findings of the Association for Computational Linguistics: ACL 2023 (``ACL 2023, CCF-A``).
(23) Exploiting Rich Textual User-Product Context for Improving Personalized Sentiment Analysis. [paper]

Chenyang Lyu, Linyi Yang, Yue Zhang, Yvette Graham, Jennifer Foster.

Findings of the Association for Computational Linguistics: ACL 2023 (``ACL 2023, CCF-A``).
(22) On the Robustness of ChatGPT: An Adversarial and Out-of-distribution Perspective. [paper];

Jindong Wang, Xixu Hu, Wenxin Hou, Hao Chen, Runkai Zheng, Yidong Wang, Linyi Yang, Haojun Huang, Wei Ye, Xiubo Geng, Binxin Jiao, Yue Zhang, Xing Xie.

Workshop on Trustworthy and Reliable Large-Scale Machine Learning Models at ICLR 2023 (``RTML Workshop 2023``).
(21) SciMine: An Efficient Systematic Prioritization Model Based on Richer Semantic Information. [paper]

Fang Guo, Yun Luo, Linyi Yang, Yue Zhang.

The 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (``SIGIR 2023, CCF-A``).
(20) Graph-Based Video-Language Learning with Multi-Grained Audio-Visual Alignment. [paper]

Chenyang Lyu, Wenxi Li, Tianbo Ji, Longyue Wang, Liting Zhou, Cathal Gurrin, Linyi Yang, Yi Yu, Yvette Graham, Jennifer Foster.

Proceedings of the 31st ACM International Conference on Multimedia (``MM 2023, CCF-A``).
(19) Survey on factuality in large language models: Knowledge, retrieval and domain-specificity. [paper]

Cunxiang Wang, Xiaoze Liu, Yuanhao Yue, Xiangru Tang, Tianhang Zhang, Cheng Jiayang, Yunzhi Yao, Wenyang Gao, Xuming Hu, Zehan Qi, Yidong Wang, Linyi Yang, Jindong Wang, Xing Xie, Zheng Zhang, Yue Zhang.

TIST (``TIST 2023``).
(18) USB: A Unified Semi-supervised Learning Benchmark for Classification. [paper]

Yidong Wang, Hao Chen, Yue Fan, Wang Sun, Ran Tao, Wenxin Hou, Renjie Wang, Linyi Yang, Zhi Zhou, Lan-Zhe Guo, Heli Qi, Zhen Wu, Yu-Feng Li, Satoshi Nakamura, Wei Ye, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang, Xing Xie, Yue Zhang.

NeurIPS Dataset and Benchmark (``NeurIPS 2022, CCF-A``).
(17) A Rationale-Centric Framework for Human-in-the-loop Machine Learning. [paper]

Jinghui Lu, Linyi Yang, Brian Mac Namee, Yue Zhang.

ACL (``ACL 2022 (Oral), CCF-A``).
(16) FactMix: Using a Few Labeled In-domain Examples to Generalize to Cross-domain Named Entity Recognition. [paper]

Linyi Yang, Lifan Yuan, Leyang Cui, Wenyang Gao, Yue Zhang.

COLING (``COLING 2022 (Oral)``).
(15) NumHTML: Numeric-Oriented Hierarchical Transformer Model for Multi-task Financial Forecasting. [paper]

Linyi Yang, Jiazheng Li, Ruihai Dong, Yue Zhang, Barry Smyth.

AAAI (``AAAI 2022 (Oral), CCF-A``).
(14) Towards Fine-grained Causal Reasoning and QA. [paper]

Linyi Yang, Zhen Wang, Yuxiang Wu, Jie Yang, Yue Zhang.

Asking ‘‘Why’’ Questions (``Arxiv 2022``).
(13) Exploring the Efficacy of Automatically Generated Counterfactuals for Sentiment Analysis. [paper]

Linyi Yang, Jiazheng Li, Pádraig Cunningham, Yue Zhang, Barry Smyth, Ruihai Dong.

We propose an alternative to automatically generating counterfactual data for data augmentation and explanation. (``ACL 2021 (Oral), CCF-A``).
(12) Generating Plausible Counterfactual Explanations for Deep Transformers in Financial Text Classification. [paper]

Linyi Yang, Eoin M Kenny, Tin Lok James Ng, Yi Yang, Barry Smyth, Ruihai Dong.

This paper proposes a novel methodology for producing plausible counterfactual explanations (``COLING 2020 (Oral)``).
(11) MAEC: A Multimodal Aligned Earnings Conference Call Dataset for Financial Risk Prediction. [paper]

Linyi Yang, Jiazheng Li, Barry Smyth, Ruihai Dong.

We introduce a new, large-scale, multi-modal, text-audio paired, earnings-call dataset named MAEC, based on S&P 1500 companies. (``CIKM 2020 (Oral)``).
(10) HTML: Hierarchical Transformer-based Multi-task Learning for Volatility Prediction. [paper]

Linyi Yang, Tin Lok James Ng, Barry Smyth, Ruihai Dong.

This paper proposes a novel hierarchical, transformer, multi-task architecture to harness the text and audio data from quarterly earnings conference calls to predict future price volatility. (``WWW 2020 (Oral), CCF-A``).

🎤 Invited Talks

Shanghai Chuangzhi Lab, Shanghai, 2025
Shanghai Jiaotong University, Shanghai, 2025
SUSTech, Shenzhen, 2025
Zhejiang Lab, Hangzhou, 2024
HKUST (GZ), Guangzhou, 2024
HKUST, HongKong, 2024
Nanjing University, Nanjing, 2024
MSRA, Online, 2023
Shanghai AI Lab, Shanghai, China 2023
MLNLP, Online, China 2022
MSRA, Online, 2022

Linyi Yang