8 9 3

Junjie Ye

Junjie-Ye

AI & ML interests

None yet

Recent Activity

new activity 24 days ago

bytedance-research/ToolHop:是否会继续评测呢？

authored a paper about 1 month ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

authored a paper 3 months ago

Analyzing the Effects of Supervised Fine-Tuning on Model Knowledge from Token and Parameter Levels

View all activity

Organizations

authored a paper about 1 month ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

Paper • 2510.24320 • Published Oct 28 • 18

authored 2 papers 3 months ago

Analyzing the Effects of Supervised Fine-Tuning on Model Knowledge from Token and Parameter Levels

Paper • 2509.16596 • Published Sep 20 • 14

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

Paper • 2509.08755 • Published Sep 10 • 56

authored 2 papers 4 months ago

CRITICTOOL: Evaluating Self-Critique Capabilities of Large Language Models in Tool-Calling Error Scenarios

Paper • 2506.13977 • Published Jun 11 • 10

Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments

Paper • 2508.08791 • Published Aug 12 • 16

authored 2 papers 7 months ago

Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric

Paper • 2502.17184 • Published Feb 24 • 1

A Multi-Dimensional Constraint Framework for Evaluating and Improving Instruction Following in Large Language Models

Paper • 2505.07591 • Published May 12 • 11

authored a paper 9 months ago

A Comprehensive Capability Analysis of GPT-3 and GPT-3.5 Series Models

Paper • 2303.10420 • Published Mar 18, 2023 • 1

authored 2 papers 11 months ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 109

ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use

Paper • 2501.02506 • Published Jan 5 • 11

authored 10 papers 12 months ago

InstructUIE: Multi-task Instruction Tuning for Unified Information Extraction

Paper • 2304.08085 • Published Apr 17, 2023

ToolEyes: Fine-Grained Evaluation for Tool Learning Capabilities of Large Language Models in Real-world Scenarios

Paper • 2401.00741 • Published Jan 1, 2024 • 1

Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback

Paper • 2401.11458 • Published Jan 21, 2024 • 2

MouSi: Poly-Visual-Expert Vision-Language Models

Paper • 2401.17221 • Published Jan 30, 2024 • 9

LLM can Achieve Self-Regulation via Hyperparameter Aware Generation

Paper • 2402.11251 • Published Feb 17, 2024 • 1

LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

Paper • 2402.14568 • Published Feb 22, 2024 • 1

Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity Recognition

Paper • 2406.11192 • Published Jun 17, 2024

SafeAligner: Safety Alignment against Jailbreak Attacks via Response Disparity Guidance

Paper • 2406.18118 • Published Jun 26, 2024

Empirical Insights on Fine-Tuning Large Language Models for Question-Answering

Paper • 2409.15825 • Published Sep 24, 2024 • 1

TL-Training: A Task-Feature-Based Framework for Training Large Language Models in Tool Use

Paper • 2412.15495 • Published Dec 20, 2024 • 1

Junjie Ye

AI & ML interests

Recent Activity

Organizations

Junjie-Ye's activity