MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing

Zhang, Kai; Mo, Lingbo; Chen, Wenhu; Sun, Huan; Su, Yu

Computer Science > Computer Vision and Pattern Recognition

arXiv:2306.10012 (cs)

[Submitted on 16 Jun 2023 (v1), last revised 15 May 2024 (this version, v3)]

Title:MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing

Authors:Kai Zhang, Lingbo Mo, Wenhu Chen, Huan Sun, Yu Su

View PDF HTML (experimental)

Abstract:Text-guided image editing is widely needed in daily life, ranging from personal use to professional applications such as Photoshop. However, existing methods are either zero-shot or trained on an automatically synthesized dataset, which contains a high volume of noise. Thus, they still require lots of manual tuning to produce desirable outcomes in practice. To address this issue, we introduce MagicBrush (this https URL), the first large-scale, manually annotated dataset for instruction-guided real image editing that covers diverse scenarios: single-turn, multi-turn, mask-provided, and mask-free editing. MagicBrush comprises over 10K manually annotated triplets (source image, instruction, target image), which supports trainining large-scale text-guided image editing models. We fine-tune InstructPix2Pix on MagicBrush and show that the new model can produce much better images according to human evaluation. We further conduct extensive experiments to evaluate current image editing baselines from multiple dimensions including quantitative, qualitative, and human evaluations. The results reveal the challenging nature of our dataset and the gap between current baselines and real-world editing needs.

Comments:	NeurIPS 2023; Website: this https URL
Subjects:	Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Computation and Language (cs.CL)
Cite as:	arXiv:2306.10012 [cs.CV]
	(or arXiv:2306.10012v3 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2306.10012

Submission history

From: Kai Zhang [view email]
[v1] Fri, 16 Jun 2023 17:58:58 UTC (19,034 KB)
[v2] Wed, 29 Nov 2023 21:59:11 UTC (20,885 KB)
[v3] Wed, 15 May 2024 18:20:28 UTC (20,884 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators