米米的博客

做了一点微小的工作

标签云拟合Octocat

笔者最近发现了一个神奇的 Python 库,名为 wordcloud。借助它,可以轻松地用标签云拼出一副图片,就像上图这样。让我们一起看看具体的步骤吧。

环境

请确保 Python 3 和 pip3(即python3 -m pip)都可以正常使用。需要使用 pip 安装的模块有:

  • matplotlib
  • numpy
  • pillow
  • requests
  • wordcloud

其中wordcloud模块有些特殊,笔者尝试执行pip3 install wordcloud,结果报错了。如果你也遇到了类似的问题,请执行以下安装方式:

1
2
3
4
git clone https://github.com/amueller/word_cloud.git
cd word_cloud
pip3 install -r requirements.txt
python3 setup.py install

这样就完成安装了。

阅读全文 »

在使用 VPS 时,如果出现内存不够用的情况,可能会产生各种奇怪的问题。这个时候,增加 Swap 空间,就可以起到救急的作用。下面就来看看具体步骤。

创建 Swap 文件

检查 Swap 空间

先检查一下系统里有没有既存的 Swap 文件:

1
swapon -s

如果返回的信息概要是空的,则表示 Swap 文件不存在。

创建 Swap

使用fallocate为 Swap 文件预分配空间:

1
fallocate -l 1G /swapfile

如果fallocate分配空间不成功的话,可以用dd命令代替:

1
dd if=/dev/zero of=/swapfile bs=1024 count=1048576 #分配1G的Swap空间

参数说明:

  • if=input file:输入文件名,缺省为标准输入。即指定源文件。
  • of=output file:输出文件名,缺省为标准输出。即指定目的文件。
  • bs=bytes:同时设置读入 / 输出的块大小为 bytes 个字节,取为 1024。
  • count=blocks:拷贝的块数,块大小等于 bs 指定的字节数。将前面算出的数字填入即可。

我们需要根据需求(即要分配的 Swap 文件的大小)来计算出参数。上面示范的做法是,每次读写 1KiB,重复 N 次,这样可以兼顾内存消耗和读写次数。因此,如果以 MiB 为单位计算你要分配的 Swap 文件的大小,那么读写次数(拷贝的块数)就是将该值乘以 1024 得到结果。例如,块大小为 1KiB 时,64MiB 的 Swap 文件拷贝的块数是 65536,而 1GiB 的 Swap 文件则是 1048576。

这里的if=/dev/zero意味着向/swapfile填满空字符。经笔者测试,将它换成/dev/urandom,也可以正常初始化。

阅读全文 »

科幻大片里的电路背景看上去是非常复杂的也是非常炫酷的,不过用滤镜来制作却不是很复杂。先把一些纹理处理成网格效果,然后用查找边缘等滤镜加强网络的边缘线条,后期细化一下线条,调整一下颜色即可。

科幻电路板效果

阅读全文 »

「表情包」是一种利用图片来表示感情的方式。在各种社交软件的带动下,「表情包」已经形成了一种流行文化。互联网上,基本人人都会发表情;很多实时通讯软件中,「斗图」成为了一种活跃气氛的常见方式。不知你是否曾有过找不到表情包去应对别人的时候?
今天笔者分享用 Python 开发个人专属的表情包网站的方法,想用什么表情包搜一下就有了!
目标:获取海量表情包,存入数据库,然后搭建简单网站,通过输入关键字获取对应的的表情包。

创建数据库

首先,我们要从这个网站爬取表情包:斗图啦
我们先来分析一下这个网页的源代码:

检查元素

通过源码,我们可以发现需要获取的内容包括每个<img>标签的data-originalalt属性。通过爬虫获取网页,用正则表达式提取内容,然后存入数据库即可。
这里用到的数据库是 MySQL。如果还没有安装的话,不妨参考前面的文章 MySQL 8.0 的安装和使用

安装完成后,你可以用 root,也可以创建一个新用户,来新建数据库和数据表,用来存放表情包:

1
2
3
4
5
6
7
8
9
10
#建立数据库images
CREATE DATABASE images;
USE images;
#然后在该数据库中新建一个表,并添加相应的name和imageUrl
CREATE TABLE images (
id int(10) UNSIGNED PRIMARY KEY NOT NULL AUTO_INCREMENT,
name varchar(1000),
imageUrl varchar(200)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
QUIT;

至此数据库方面的工作就完成了。

安装依赖

依赖包是requestsmysql-connector-pythonFlask。使用pip进行安装即可。

阅读全文 »
0%