拉布拉多训练工具( 三 )


绝大部分时候,我们需要修改的部分,就只有一些文件路径(xxx_path)、训练回合数(num_epoch)、批量数(batch_size_per_gpu),以及 dataset_config 里面的类别名称(target_class_mapping)的对应值 。除非有特别的要求,并且您熟悉该神经网络的结构与特性,否则使用英伟达提供的优化配置参数,是足以获得一定水平之上的效果 。
(4)集成迁移学习功能:
这是一种将学习到的特征,从一个应用程序转移到另一个应用程序的过程 。与从头开始训练同一模型相比,迁移学习的方式可以使用较少的数据集或较短的时间,训练出相同精确度的模型 。
英伟达 NGC 中心提供数十种由专业技术人员基于专业数据集,在高端训练设备预训练出来的优质模型文件,可以纳入 TAO 的模型训练过程,非常有效地减少模型训练所耗费的时间成本 。
以上就是 TAO 工具套件的关键技术,经过英伟达的一番整合之后,将“神经网络算法知识”与“机器学习框架”这两个技术门槛最高的部分给边缘化了,也就是说不具备这两方面技术能力的人,都能轻松执行模型训练的任务,剩下避不开的任务,就是“数据收集与标注”这项技术含量较低的工作了 。
下图是 TAO 工具套件的技术框架图,可以看到这个工具支持视觉人工智能(Vision AI)与对话人工智能(Conversation AI)两大类应用,能让我们很轻松地创建更高价值的整合性人工智能应用 。
除此之外,TAO 工具套件在便利性方面,还具备以下三个特色:
安装便利性:基于Docker容器技术进行封装使用者只需要在装有 CUDA GPU 计算卡的 x86 设备上,安装合适的驱动与 docker、nv-docker 等管理软件即可,其他所需要的 CUDA、CUDNN、TensorRT 等开发资源,都预先打包在容器镜像之内 。
操作便利性:以Jupyter为交互操作界面这是个基于浏览器的互动式操作界面,使用者可以在任何一台能连上训练设备的电脑上执行模型训练的工作 。
TAO 也为所支持的神经网络都提供专属的执行脚本,并将所有需要的执行步骤提供完整的 CLI 指令,使用者只需要简单调整数据存放路径与配置文件的对应路径即可,几乎不需要撰写任何 C++ 或 Python 代码;
部署便利性:与推理套件无缝对接TAO 所训练出来的文件,是兼容于 TensorRT 加速引擎的中间模型,只要在推理平台上透过“tao_converter”工具,就能轻松转换成该平台上的 TensorRT 加速引擎,无需透过繁琐的 ONNX 方式进行转换 。
此外,这个中间模型也能在推理平台上,无缝地与 DeepStream、Triton Server、RIVA 这些推理工具进行对接,大幅降低过去部署过程的复杂度,让整个应用流程变得十分轻松 。
现在开始使用 TAO 工具套件,就能比传统模型训练的过程,减少 90% 的学习、撰写代码、测试与部署等步骤所需要的时间,让研发单位提高应用开发效率,更快速、更高频地开发高价值的人工智能应用 。