分享

今日数据分析 - 二三小事

 生信药丸 2022-08-12 发布于贵州

1. 迂回下载海外组学数据

前段时间,集群出了点状况,多少影响了数据分析进度。目前也没集群可用,于是只能用自己的电脑。人在贵阳,好在前段时间还是下血本(两个月的工资)搞了一个工作电脑,勉强可以用来跑跑小型的组学数据。然而,数据传输或者下载又是一个问题。或许是我个人错觉,也或许是现在就这样,我们要从 NCBI SRA 下载数据是比较....麻烦的,速度实在太慢。于是大体折腾了下,迂回解决这个问题:

  1. 购买香港主机,直接从香港主机下载

  2. 中间跳板(使用Piping Sever)

  3. 本地服务器接受数据(还是使用 Piping Server)

事实上,我是想用一些大文件快传软件的,不过似乎目前并没有好的实现软件。以前用的,都不行了。piping-server还是比较方便或许... 当然这个可以用在更多有趣的地方。

2. docker build -t scauclass

Emmm,同样,是希望在本地使用以前构建的镜像。但是死活跑不起来。报错大体如下

各种搜索,找不到解决方法。不过不能build,却可以直接load已有镜像。最后还是问了下基友孙总,得到解决办法是:
直接新建一个目录,把Dockerfile 放进去,在里面build就可以了,有点意思。具体逻辑是:docker build 的时候会对工作目录中所有文件做索引进去,方便ADD或者COPY。由于我直接在E盘搞,可能有一些文件或者程序不被支持之类,所以出这个问题....

3. samtools 无法处理染色体过长的材料

在大基因组上,samtools或者bwa系列可能会有这个问题。我想,主要还是一个性能考量。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多