一、介绍 MinerU作为一款智能数据提取工具,其核心功能之一是处理PDF文档和网页内容,将其中的文本、图像、表格、公式等信息提取出来,并转换为易于阅读和编辑的格式(如Markdown)。在这个过程中,MinerU需要利用图像识别、文本识别(OCR)、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。 二、构建流程 系统:Ubuntu系统, 显卡:3090, 显存:24G,cuda11.8 特别提示:使用显卡3060也可以(没尝试,感觉可以) 1.查看系统是...【查看原文】