前言

Colab是Google提供的免费的notebook,提供免费的GPU和存储空间使用。虽然GPU设备很好(我这里显示是Tesla T4),可实际计算速度不快,也许是虚拟化或者IO的问题。但是,跑跑示例代码的话还是足够的。

今天我用colab跑示例代码,发现colab下载带宽很足,下载13G的MS-COCO数据集仅花了234s(大概4分钟)。此外,colab还能挂载Google Drive。也就是说我们可以利用colab把文件下载到Google Drive上,然后从Google Drive把文件下载到本地。

详细步骤

  1. 挂载Google Drive,利用Colab提供的挂载代码:

    1
    2
    from google.colab import drive
    drive.mount('/content/drive')

    验证成功后,你的Google Drive就挂载在 /content/drive/My Drive 上了。

  2. Colab下载,这里假设我们要下载MS-COCO数据集:

    1
    2
    3
    4
    5
    # 白嫖colab流量
    image_zip = tf.keras.utils.get_file('/content/drive/My Drive/train2014.zip',
    cache_subdir=os.path.abspath('.'),
    origin = 'http://images.cocodataset.org/zips/train2014.zip',
    extract = False)

    注意:虽然colab显示下载完成,但Google Drive要等待几分钟才能看到文件(如下图),文件越大等待时间越长,因此我猜是文件网络传输的时间。
    img

  3. Google Drive下载,最后再从Drive下载数据集到本地就行了。由于Google Drive是不限速的,所以速度很快(前提是你有一个好用的梯子)。

总结

想要用此法白嫖一定要有个好用的梯子,并且Google Drive有足够的存储空间。

参考

Google Colab