首页 前端知识 从网页上直接扒取latex格式的公式

从网页上直接扒取latex格式的公式

2024-05-07 13:05:34 前端知识 前端哥 429 191 我要收藏

latex是写公式非常方便的格式,很多具有专业性质的网站,发布者在发布公式内容时都采用的latex的形式。但是我们读者看的时候这些公式是图片的形式,不方便扒取下来进行编辑。最近写作业的时候遇到这个问题,联想到了HTML,稍微研究了一下网页,找到了这个偷懒的方法。
这里以知乎为例。
在这里插入图片描述

这是知乎的一篇关于高斯核函数可改写成内积形式的推导,推导部分自己重新推一遍问题不大,但是里面有个多项式展开的公式形式很复杂,属实不想再在latex里面敲一遍:
在这里插入图片描述

这个时候我们就需要用到HTML。首先按f12打开网页查看器,我用的是火狐浏览器,不同浏览器操作上可能有细微的差别,大家自己摸索一下就行。初始的界面是很简洁的,如下图所示。
在这里插入图片描述

接下来我们打开网页的body,发现变得很复杂。但是看一下就会发现下面都是些js的,我们要的内容没关系,就在这些js上面的root标签里面:
在这里插入图片描述

依次点开root→App→App-main的标签,可以发现基本上没找错。同时可以借助浏览器的指示器确认一下,是网页的主体部分。
在这里插入图片描述在这里插入图片描述

接下来就是一样的过程,同样借助浏览器的指示,找到网页具体内容的css格式部分。每一次的展开我就不具体展示了,直接看到展开的我们需要的内容:
在这里插入图片描述

可以看到,每一行的data-pid就对应了网页的一行。借助指示器找到我们要的那一行公式,展开:
在这里插入图片描述我们需要的公式就在里面了:
在这里插入图片描述

双击公式的地方,可以进入编辑状态,直接复制latex代码。
在这里插入图片描述

复制到latex编辑器里看一下效果:
在这里插入图片描述在这里插入图片描述

之后就可以随意编辑了。

转载请注明出处或者链接地址:https://www.qianduange.cn//article/7343.html
评论
发布的文章

exceljs

2024-05-11 10:05:00

Java研学-JSON与AJAX

2024-05-10 22:05:37

大家推荐的文章
会员中心 联系我 留言建议 回顶部
复制成功!