基于远程监控的关系抽取实验

    技术2022-08-11  82

    基于远程监控的关系抽取实验rel_ext_02_experiments.ipynb

    __author__ = "Bill MacCartney and Christopher Potts" __version__ = "CS224u, Stanford, Spring 2020"

    目录

    概述 导入库 构建分类器 实验 分析 检查训练模型 发现新的关系实例

    概述

    在训练数据上训练分类器,在测试数据上评估预测结果。我们从一个最简单的机器学习开始:使用词袋特征表示及逻辑回归模型,将利用sklearn库,用于特征化实例、训练模型、进行预测和评估结果。

    导入库

    from collections import Counter import os import rel_ext import utils 段智华 认证博客专家 Spark AI 企业级AI技术 本人从事大数据人工智能开发和运维工作十余年,码龄5年,深入研究Spark源码,参与王家林大咖主编出版Spark+AI系列图书5本,清华大学出版社最新出版2本新书《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版、《企业级AI技术内幕:深度学习框架开发+机器学习案例实战+Alluxio解密》,《企业级AI技术内幕》新书分为盘古人工智能框架开发专题篇、机器学习案例实战篇、分布式内存管理系统Alluxio解密篇。Spark新书第二版以数据智能为灵魂,包括内核解密篇,商业案例篇,性能调优篇和Spark+AI解密篇。从2015年开始撰写博文,累计原创1059篇,博客阅读量达155万次
    Processed: 0.015, SQL: 9