Skip to content

dotnet OpenXML 如何判断是形状还是文本

Updated: at 08:22,Created: at 03:27

在 OpenXML 格式里面,其实不存在文本这个元素,所有都是形状。但是在 PPT 界面看到的文本框是什么呢?其实他是特别的形状。而几乎所有的形状都可以输入文本,因此区分形状和文本的意义不会特别大,只是在做解析的时候才会碰到

在 OpenXML 的 PML 也就是 PPT 使用的格式里面,在 dotnet OpenXML 解析 PPT 页面元素文档格式 告诉大家都是形状

那么文本框是什么形状?其实文本框是特别的形状

在 PPT 里面拖入文本框,然后使用 OpenXML 解压缩文档为文件夹工具 解压缩,此时可以看到在页面里的元素大概内容如下

<p:sp>
<p:nvSpPr>
<p:cNvSpPr txBox="1"/>
</p:nvSpPr>
<!-- 忽略 -->
</p:sp>

也就是说文本框也是 p:sp 也就是 Shape 元素,但是在 p:nvSpPr->p:cNvSpPr->txBox 有属性表示是文本框

在 dotnet 里面通过 OpenXML SDK 可以这样获取

// nvSpPr
NonVisualShapeProperties nonVisualShapeProperties = shape.NonVisualShapeProperties;
// cNvSpPr
var nonVisualShapeDrawingProperties = nonVisualShapeProperties?.NonVisualShapeDrawingProperties;
var isTextBox = nonVisualShapeDrawingProperties?.TextBox?.Value is true;

在 OpenXML SDK 的帮助下,可以解析很多 PPT 文档的缩写,可以提升可读性。如 nvSpPr 其实就是 Non(n) Visual(v) Shape(Sp) Properties(pr) 的意思

更多请看 Office 使用 OpenXML SDK 解析文档博客目录


知识共享许可协议

原文链接: http://blog.lindexi.com/post/dotnet-OpenXML-%E5%A6%82%E4%BD%95%E5%88%A4%E6%96%AD%E6%98%AF%E5%BD%A2%E7%8A%B6%E8%BF%98%E6%98%AF%E6%96%87%E6%9C%AC

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。 欢迎转载、使用、重新发布,但务必保留文章署名 林德熙 (包含链接: https://blog.lindexi.com ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请与我 联系