跳转到主要内容

Base URL

https://somark.tech/api/v1

鉴权

所有接口均通过请求体中的 api_key 字段传入 API 密钥,格式为 sk-***
# multipart/form-data 示例
-F "api_key=sk-your-api-key"

接口列表

如果你需要在一次请求里直接拿到结果,优先使用同步解析,适合交互式调用、小到中等文件、需要立刻展示结果的场景。如果文件较大、页数较多、处理时间可能较长,或者你要做批量任务、后台任务编排,优先使用异步解析:先提交异步任务,再通过 结果查询 基于 task_id 轮询结果,更稳妥,也更容易做重试和队列控制。额度和账号状态可通过用量查询查看。
接口方法路径说明
同步解析POST/parse/sync上传文件,立即返回解析结果
异步解析POST/parse/async + /parse/async_check提交任务并基于 task_id 轮询结果
用量查询POST/usage查询当前 API 密钥的剩余额度与账号信息
路径迁移提示:自本版本起,所有解析接口路径从 /extract/ 变更为 /parse/。旧路径(/extract/acc_sync/extract/async/extract/async_check)将于 2026-12-31 停用,请在此之前迁移至新路径。

使用限制

  • 文件大小:单文件最大 200MB
  • 页数限制:单次最多 300 页
  • 调用频率:Beta 阶段 QPS 1(每账号)

支持的文件格式

pdf png jpg jpeg bmp tiff jp2 dib ppm pgm pbm gif heic heif webp xpm tga dds xbm doc docx ppt pptx xlsx xlsm xls

可识别的文档元素

标题
标题
文字段
文字段
图片
图片
图例
图例
表格
表格
表例
表例
公式
公式
页眉
页眉
页脚
页脚
侧边栏
侧边栏
脚注
脚注
目录
目录
目录条目
目录条目
选项
选项
代码段
代码段
填空空白
填空空白
参考文献
参考文献
二维码
二维码
印章
印章
化学结构式
化学结构式
化学方程式
化学方程式

错误码

所有接口返回统一的 code 字段,非 0 时表示出错。完整错误码列表见错误码参考