<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Document-Parsing on OHTLY Blog</title>
    <link>https://blog.ohtly.com/tags/document-parsing/</link>
    <description>Recent content in Document-Parsing on OHTLY Blog</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sat, 04 Jul 2026 23:17:44 +0800</lastBuildDate>
    <atom:link href="https://blog.ohtly.com/tags/document-parsing/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>MinerU 文档解析：VLM 引擎为什么这么吃资源</title>
      <link>https://blog.ohtly.com/posts/2026-07-04-mineru-vlm-engine-memory/</link>
      <pubDate>Sat, 04 Jul 2026 23:16:53 +0800</pubDate>
      <guid>https://blog.ohtly.com/posts/2026-07-04-mineru-vlm-engine-memory/</guid>
      <description>&lt;p&gt;MinerU 是一款高精度文档解析工具，支持 PDF、图片、DOCX、PPTX、XLSX 等多种格式。&lt;/p&gt;&#xA;&lt;p&gt;它有三种解析后端：&lt;code&gt;pipeline&lt;/code&gt;、&lt;code&gt;vlm-engine&lt;/code&gt;、&lt;code&gt;hybrid-engine&lt;/code&gt;。其中 &lt;code&gt;vlm-engine&lt;/code&gt; 精度最高，但资源消耗也最夸张——跑一次解析，&lt;strong&gt;23GB 系统内存 + 14GB 显存&lt;/strong&gt;被占满，解析完还不释放。&lt;/p&gt;&#xA;&lt;p&gt;这篇文章记录 vlm-engine 为什么这么吃资源、其他后端的工作原理、以及什么时候该用哪个。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
