Post List

987 words 1 mins.

# Named Entity Recognition via Machine Reading Comprehension: A https://arxiv.org/abs/2309.11027 # 发表日期 2023 年 9 月 # 作者 Yibo Wang, Wenting Zhao, Yao Wan, Zhongfen Deng, Philip S. Yu University of Illinois Chicago(伊利诺伊大学芝加哥分校) #...
2.6k words 2 mins.

# Template-Based Named Entity Recognition Using BART # 前言 这是一篇发表于 2021 年 ACL findings 的论文,主要的方法是通过构造提示模版来解决 NER 问题,使用的 BART 这样的 Encoder 和 Decoder 结构。https://aclanthology.org/2021.findings-acl.161/ # 日期 2021 年 # 作者 Leyang Cui, Yu Wu, Jian Liu, Sen Yang, Yue Zhang 浙江大学 微软研究院 西湖大学 #...
545 words 1 mins.

# 前言 powershell 时常常需要获取管理员权限,例如修改系统代理 # 代码 l@echo offcd /d "%~dp0"cacls.exe "%SystemDrive%\System Volume Information" >nul 2>nulif %errorlevel%==0 goto Adminif exist "%temp%\getadmin.vbs" del /f /q "%temp%\getadmin.vbs"echo Set RequestUAC =...
5k words 5 mins.

# PromptNER: Prompt Locating and Typing for Named Entity Recognition # 前言 这是一篇发表于 Arxiv 2023 5 月 26 日的 ACL2023 的文章。其原文网址为:https://arxiv.org/abs/2305.17104。 # 日期 2023 年 5 月 26 日 # 作者 Yongliang Shen, Zeqi Tan, Shuhui Wu, Wenqi Zhang,Rongsheng Zhang, Yadong Xi, Weiming Lu†, Yueting...
2.1k words 2 mins.

# PCBERT: Parent and Child BERT for Chinese Few-shot NER # 前言 这是一篇发表于 COLING 2022 的文章,本文主要分析其 PCBERT 的 CBERT 源码部分。 # C-BERT 源码部分 在 C-BERT 部分的 BERT 仍然保持 LEBERT 部分,主要的改动部分在于 prompt 部分,也就是对应的 P-BERT 部分。 # [batch_size, 4, 512]prompt_inputs = it['prompt_input_ids']prompt_inputs =...
2.1k words 2 mins.

# 前言 在做 MLM 实验的时候,我经常对 BERT 中 AttentionMask 的值表示疑惑。在之前的实验操作中,如果一个 Token 被设置为 [MASK],其 AttentionMask 就被设置为 0 以将其注意力忽略,但是细细思考又觉得这样的做法其实有问题 —— 如果注意力忽略,那么 [MASK] 和 [PAD] 又有什么区别? # 区别测试 检测很简单,一般来说预训练模型都做过 NSP 和 MLM 任务,我们只需要构造一个通用的语句然后让其还原即可: 测试 1: 测试语句: 北京欢迎你! MLM 任务: 北京[MASK][MASK]你 测试代码: # load...
5k words 5 mins.

# CONTaiNER: Few-Shot Named Entity Recognition via Contrastive Learning # 前言 这是一篇 Pennsylvania State University(宾夕法尼亚州立大学)发布在 Arxiv 的预印本。原文链接:https://arxiv.org/abs/2109.07589 # 日期 2021 年 9 月 15 日 V1 版本。 2022 年 5 月 28 日 V2 版本 # 作者 Sarkar Snigdha Sarathi Das, Arzoo Katiyar, Rebecca J. Passonneau, Rui...
981 words 1 mins.

# 前言 本篇时间为 2023 年 9 月,主要记录 MSSQL 部署过程及遇到的问题,后续官方可能发布了新的版本以支持 Ubuntu22.04。微软的 MSSQL 截止目前仅支持到 ubuntu20.04,如果使用 ubuntu22.04 安装则会出现依赖报错的情况,因此在 ubuntu22.04 仅能使用 docker 上的 dev 版本的 MSSQL 作为平替。 # 部署 MSSQL 编写 docker-compose.yml version: '3'services: mssql-server: image:...
6.5k words 6 mins.

# PromptNER: A Prompting Method for Few-shot Named Entity Recognition via k Nearest Neighbor Search # 前言 PromptNER 是 2023 年 5 月 20 日复旦大学计算机科学学院和上海市智能信息重点实验室发布在 Arxiv 的预印本。原文链接为:https://arxiv.org/abs/2305.12217 # 日期 2023 年 5 月 20 日 # 作者 Mozhi Zhang, Hang Yan, Yaqian Zhou, Xipeng...
152 words 1 mins.

# 前言 双手合理的打字键盘分配可以有效的增加打字速度。 # 练习的网站 键位矫正打字网站 https://www.typingclub.com/ # 评价指标 WPM(words per minute) 比较快的需要达到中文 70WPM 以上(英文 80WPM 以上) # 参考资料 https://sspai.com/post/45721