0%

一直想完成我心中很想做的一个东西,不过好难啊,只好拆接下来,一步一步来咯。

第一步,就是用python识别语音的音调。

praat

先说个不用python的方法。最初是偶然找到了praat这个软件,很简单,打开praat-点open-read from file - view & edit - pitch - show pitch 就可以啦(注意要短于10秒,如果超过的话zoom in才能看到线条)。

截屏2021-10-27 下午9.37.50

阅读全文 »

之前有写过,但是和youtube-dl一样,写了之后迫于各种问题可能还一直没真正用起来……

这两天又抽空折腾了一下,还是不能用……但是写都写了,就发上来好啦

升级

用you-get

1
you-get https://github.com/soimort/you-get/archive/master.zip
阅读全文 »

上次写过youtube-dl的一些基本使用方法,但是实际上由于某些原因一直没有办法真正用上……

今天突发奇想又折腾了一下,终于真的能下载东西了!

记录一下一些有用的东西~

最基本的下载方法(会下载到terminal当前的文件夹下):

1
youtube-dl 'http://...'
阅读全文 »

由于notion里目录不能悬浮,所以大家各显神通解决这一问题。我搜了半天,觉得比较靠谱的有两种方法。

第一种,手动将目录放到左侧,适用于内容不太多的文档。

第二种,将目录/最开头的内容 copy link然后做一个跳转的button

阅读全文 »

折腾了半天结果居然是拼错了,emmm……无论如何,记录一下这个过程好啦

一开始以为是环境不一样,开始找怎么查询环境和改变环境。

  1. 查询当前VScode环境(VScode界面左下方)

  2. 查询当前terminal环境

    1
    python --version
  3. 改变termianl的python版本

    1
    2
    3
    4
    5
    6
    7
    8
    #查看python安装路径
    ls -l /usr/local/bin/python*

    #更改
    ln -s -f /usr/local/bin/python3.8 /usr/local/bin/python #这个路径是上面结果第一行的路径

    #关闭terminal再次打开查看路径
    python --version

    当然,我没有改,主要是看到知乎上有人说这样可能会影响一些调用python2的软件。

    Reference:在Mac终端修改Python版本

但是后来想起来用的pip安装的,调用pip安装时都是要先python3 -m pip install xx,所以肯定也是python3,所以就不是这个问题,于是开始想是不是安装路径的问题。

  1. 查看一下当前vscode import路径

    1
    2
    import sys
    print(sys.path)
  2. 经过一同查询,发现pip一般会安装在/usr/local/lib/python3.7/site-packages的路径中,确认刚刚sys.path的结果里有这个地方,再去finder里进这个路径里,看一下里面有没有安装的目标包,发现有,然后把文件名复制粘贴过来就成了,所以结果是拼写错误……

阅读全文 »

安装插件

首先需要两个插件,分别是 csv converterAdvanced Browser

安装过程:进入anki - 工具 - 插件 (快捷键 Shift+command+A)- 获取插件 - 输入代码 874215009 和 1967530655

安装后重启就可以使用

找到需要导出的列

阅读全文 »

最近要做数据分析,总要跟excel打交道,我好懒,于是打算用python搞搞excel

读取

使用的库是xlrd,基本操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
import xlrd
with xlrd.open_workbook('x.xlsx') as workbook: #打开文档
worksheet=workbook.sheet_by_name('Sheet1') #读取工作表
for row_index in range(worksheet.nrows): #对于每一行
content = worksheet.cell_value(row_index, 0) #获取某个格的内容

#或者另外一种方法读取excel
data_excel=xlrd.open_workbook('data/dataset.xlsx')

# 获取所有sheet名称
names=data_excel.sheet_names()

# 获取book中的sheet工作表的三种方法,返回一个xlrd.sheet.Sheet()对象
table=data_excel.sheets()[0] # 通过索引顺序获取sheet
table=data_excel.sheet_by_index(sheetx=0) # 通过索引顺序获取sheet
table=data_excel.sheet_by_name(sheet_name='Sheet1') # 通过名称获取

# excel工作表的行列操作
n_rows=table.nrows # 获取该sheet中的有效行数
n_cols=table.ncols # 获取该sheet中的有效列数
row_list=table.row(rowx=0) # 返回某行中所有的单元格对象组成的列表
cols_list=table.col(colx=0) # 返回某列中所有的单元格对象组成的列表
content_list = worksheet.row_values(0) #获取某行中所有的单元格内容组成的列表


# 返回某行中所有单元格的数据组成的列表
row_data=table.row_values(0,start_colx=0,end_colx=None)

# 返回某列中所有单元格的数据组成的列表
cols_data=table.col_values(0,start_rowx=0,end_rowx=None)
row_lenth=table.row_len(0) # 返回某行的有效单元格长度

写入

阅读全文 »

突发奇想想将读取pdf做anki卡组,以为会很简单,没想到最后卡在读取word上,赶紧记在小本本上,下回读取word就不怕啦!


还是用docx库,具体安装之前写过,直接跳过写怎么用啦。

读取文档对象

1
2
3
4
5
import docx 

path = "C:\test.docx" #文件路径

file = docx.Document(path) #读取文档
阅读全文 »

目标是读取pdf做anki卡组,记录一下鼓捣了一晚上的结果。

准备工作

pdf必须是文字版 扫描版目前的识别率还是太低 即使是用FineReader也还是得手动调整 工作量太大

pdf转word

因为word读取比较方便(可能只是因为我菜) 所以我先用 adobe acrobat 将pdf转成word

阅读全文 »