快速导航×

在进行XML转换时,如何保持源文档中的空白和格式?2025-12-05 16:15:07
要保持XML转换时的空白字符,需在解析、处理和输出三环节主动配置:首先设置解析器保留空白节点,如DOM中setIgnoringElementContentWhitespace(false);其次在XSLT中使用xsl:preserve-space声明需保留空白的元素,避免xsl:strip-space;最后通过xsl:output设置indent="no"防止输出重排,并用xsl:copy-of或xsl:text精确控制文本节点输出,避免normalize-space等函数破坏原始格式。

在进行xml转换时,如何保持源文档中的空白和格式?

XML转换时默认会忽略大部分空白字符,要保持源文档中的空白和格式,关键在于控制解析器行为和XSLT处理逻辑。

设置解析器保留空白节点

大多数XML解析器(如J*a的DOM、SAX,或.NET的XmlDocument)默认会丢弃“无关空白”(即元素间用于缩进和换行的空格、制表符、回车)。需显式启用保留:

  • DOM解析器中调用 setIgnoringElementContentWhitespace(false)(J*a)或确保 XmlReaderSettings.IgnoreWhitespace = false(.NET)
  • 使用SAX时,重写 ignorableWhitespace() 方法,而非只处理 characters()
  • 对于Python的lxml,创建解析器时传入 remove_blank_text=False

在XSLT中声明保留空白的元素

XSLT本身不自动保留所有空白,但可通过 xsl:preserve-space 明确指定哪些元素的内容应保留空白:

  • 在样式表顶部添加:(适用于含格式化文本的元素)
  • 避免使用 xsl:strip-space(除非你明确想清除某些元素的空白)
  • 若需全局保留(谨慎使用),可写 ,但会影响性能且可能干扰逻辑处理

输出时控制缩进与换行

即使输入空白被保留,XSLT处理器默认输出仍可能重新格式化。需配置输出方法:

拾贝 拾贝

一键同步微信读书所有笔记和划线,并在新标签页回顾

拾贝 186 查看详情 拾贝
  • 在XSLT中添加:(禁用自动缩进)
  • 若需部分缩进但保留原始结构,改用 indent="yes" 并配合 disable-output-escaping="yes" 处理特定文本节点
  • 使用 包裹需要原样输出的换行或空格,例如:

处理文本节点时避免隐式规范化

XSLT中直接用 会合并并截断空白;应改用更精确的方式:

  • 复制原始文本节点(包括空格、换行)
  • 对混合内容(如段落内有标签和文本),用 apply-templates> 配合模板匹配 text() 节点,并关闭 normalize-space()
  • 避免在XPath中无意识使用 normalize-space(@attr)string(.) —— 它们会破坏原始空白

基本上就这些。核心是分清“输入保留”“处理不破坏”“输出不重排”三个环节,每步都需主动配置,不能依赖默认行为。

以上就是在进行XML转换时,如何保持源文档中的空白和格式?的详细内容,更多请关注其它相关文章!


# 如何用  # 西安短视频seo排名  # 长春seo外包哪家好  # 莱州seo优化推广营销  # 广汉网站建设优化  # 宝鸡seo排名合作商家  # 网站工具推广有哪些方法  # 营销推广主题公园  # 关键词排名软件询问l火28星  # 山西营销推广哪家好做点  # 关键词十佳歌手排名表格  # 若需  # 它比  # python  # 如何使用  # 样式表  # 文档  # 拾贝  # 换行  # 如何将  # 转换为  # .net  # xml解析  # app  # 处理器  # java 


相关栏目: 【 企业资讯168 】 【 行业动态20933 】 【 网络营销52431 】 【 网络学院91036 】 【 运营推广7012 】 【 科技资讯60970


相关推荐: 漫蛙漫画官方首页 漫蛙2漫画在线阅读入口  Basecamp怎样用留言钉固定重点_Basecamp用留言钉固定重点【重点标记】  Win11如何设置屏幕保护程序 Win11屏保设置与取消方法【教程】  Steam官网入口直达 Steam注册及登录步骤  在Go开发中优雅管理ListenAndServe进程:GoSublime集成方案  Win11怎么安装Linux子系统 Win11 WSL2安装Ubuntu及环境配置指南  C++的std::forward_list怎么用_C++ STL中单向链表容器的特点与应用  MinIO大规模对象列表性能瓶颈深度解析与外部元数据管理策略  Win10快速启动功能利弊分析 Win10开启或关闭快速启动教程【技巧】  AO3最新可访问网址 Archive of Our Own官方在线入口  12306选座系统怎么选连座_12306选座多人连坐操作方法  PHP 枚举:根据字符串获取枚举案例的策略与实现  聚水潭ERP登录页面入口 聚水潭ERP官网登录界面  漫蛙网页登录入口 漫蛙漫画官方授权网址  QQ邮箱登录官网首页 腾讯QQ邮箱网页入口  漫蛙manwa官网登录界面_漫蛙漫画网页版主站入口  12306怎么选座位选到安静区_12306选座安静区域选择策略  优化MinIO list_objects_v2 操作的性能瓶颈与最佳实践  如何使用J*aScript精确选择并批量修改特定父元素下子链接的样式  谷歌浏览器一键优化方案_谷歌浏览器直达主页极速不卡版  初次安装JDK时环境变量如何正确配置_J*A_HOME与PATH设置规则讲解  J*a实现学校排课程序_面向对象结构化项目示例  python3时间如何用calendar输出?  Composer如何解决json扩展缺失的错误  Win10桌面图标出现小盾牌怎么办 Win10去除UAC图标教程【解决】  在哪找SublimeJ远程工具_SFTP插件配置教程  c++如何使用chrono库处理时间_c++标准库时间与日期操作  CSS Box Model与弹性按钮:维持布局稳定的动画实践  如何提高微信支付的安全性_微信支付安全防护与设置建议  sublime怎么格式化代码_sublime代码美化与一键排版插件配置  Golang如何实现微服务鉴权与权限控制_Golang微服务鉴权与权限管理实践  J*aScript中向JSON对象添加新属性的正确姿势  Mac怎么锁定备忘录_Mac备忘录加密设置教程  sublime如何优雅地处理行尾空格_sublime自动清理多余空白字符配置  Windows10怎么开启存储感知 Windows10系统设置自动清理临时文件释放C盘空间【教程】  韩剧圈正版入口页面_韩剧圈官网登录链接  Yandex搜索引擎一键访问入口_俄罗斯Yandex官网免登录  高德地图公交到站提醒失败如何解决 高德提醒权限设置  J*a链表中的IPosition抽象与使用指南  vivo手机互传视频怎么操作_vivo手机互传视频详细传输方法  sublime侧边栏怎么增强功能_SideBarEnhancements for sublime安装与配置  《刺客信条:影》PS5 Pro和Switch 2画面对比  抖音未来赚钱的新趋势 2025年值得关注的变现风口分析  SteamMachine定价或为699美元 大家想入手吗?  抖音DOU+怎么投最有效 抖音付费推广的ROI提升技巧  “音游” × “怪文书” 题材的节奏冒险游戏 《晕晕电波症候群》确定于2026年4月发售!  zookeeper 都有哪些功能?  在J*a中如何实现简单的用户输入_J*aScanner类使用方法分享  谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示  Shopify Liquid:高效管理与访问产品变体数组属性