2018-04-11 golang 处理 yaml 格式数据 YAML 格式的数据常用来作为配置文件使用, 因此相对来说字段比较固定, 在 golang 中进行解析时跟上一篇提到的解析 json 数据有所区别 ## 阅读全文…
2018-03-30 go 语言中 JSON 数据的处理 Golang 中处理 JSON 格式数据主要依赖encoding/json这个库,很多教程(包括 Go 语言圣经)讲 JSON 数据处理时都会定义一个结构体对应于 JSON 数据的各个字段,这种处理方法在 JSON 中字段相对固定时非常实用。但对于字段可能不断变化或者只有一两个字段是固定的时候,如何处理这个问题往往令很多人感到困惑。最近研究 gin 这个库的时候发现一个思路非常值得学习借鉴。 阅读全文…
2018-01-08 网研机试101 2018考研的初试已经结束了,平时看考研群里已经有很多人在讨论在焦虑机试应该怎么复习,作为过来人在这里就随便说说自己的一些经验吧。 实现说明一下,这篇文章基本就是个扫盲,不能保证你看完文章就能从 A0变 AK,但帮助你脱离新手区,扫除对机试的恐惧,保个底让机试不会成为复试阶段的软肋还是可以的。 阅读全文…
2017-12-06 TensorFlow For Docker 初体验 TensorFlow 是一套开源的机器学习工具。一般来说只用 TensorFlow 的话配置运行环境什么的并没有特别坑的地方,但如果想用到 GPU 加速计算的话配置起来就要费好大一番力气了,还经常遇到各种版本不兼容、找不到依赖关系等问题,让人头疼。而 Docker 刚好是解决开源软件各种依赖关系的神物,NVIDIA 刚好又有工具能让容器用上 GPU 进行计算。 下面分享配置过程。 测试环境是 GTX850M+Ubuntu16.04.3+CUDA9.0+GeForce 384.00 驱动及 CUDA 安装过程参考即将到来的另一篇文章。 阅读全文…
2017-11-27 最大概率汉语切分算法研究-(0)-概览 最近忙活了将近一个多月总算把计算语言学布置的最大概率汉语切分作业写完了,虽然中途一波三折,还发生了很多五光十色奇形怪状让人难忘的事情,所幸最后还是比较完整的写了出来,也学到了不少的知识。因此便有了这个系列的文章。 在这篇给出这系列文章的导航帖汇总。 阅读全文…
2017-11-25 最大概率汉语切分算法研究(四)FMM 与 BMM 在分词中的应用 本篇继续讨论对输入句子的处理问题。FMM 和 BMM 是指对输入句子分别找前向最长词和后向最长词,某种程度上来说属于贪心算法的一种,比较惊喜的地方是两者结合常常能获得比较不错的分词效果。 阅读全文…
2017-11-25 最大概率汉语切分算法研究(三)有向无环图(DAG)与最优左近邻词 本篇讨论的是对特定输入句子进行的处理过程。基本思想是对特定输入句子从前往后遍历找出所有词构成有向无环图,然后从最后一个词开始往前找每个词的“最优左近邻词”构成一个完整的词语序列。 阅读全文…