最近更新时间:2021-03-12
1 功能描述
对中文文本,为用户提供分词和词性标注两种功能。
调用地址:https://apim.unicloud.com/api/nlp/segment/1.0.0/
请求方式:POST
返回类型:JSON
Header如下:
| 参数 | 值 | 说明 |
|---|---|---|
| Content-Type | application/json | -- |
| Authorization | Bearer | 参考Token获取 |
Body如下:
| 参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
|---|---|---|---|---|
| text | true | string | - | 待分析文本,长度建议不超过1000个汉字,超过上限接口报错 |
注:Body是raw-json格式
curl -H "Authorization:Bearer 2735fbc9-b797-31ad-812c-d8e9e903f6e3" \
-H "Content-Type:application/json" \
-d '{"text": "阳光保险集团股份有限公司于2005年7月成立"}' \
https://apim.unicloud.com/api/nlp/segment/1.0.0/curl -H "Authorization:Bearer 2735fbc9-b797-31ad-812c-d8e9e903f6e3" -H "Content-Type:application/json" -d '{"text": "阳光保险集团股份有限公司于2005年7月成立"}' https://apim.unicloud.com/api/nlp/segment/1.0.0/| 字段 | 类型 | 说明 |
|---|---|---|
| data | dict | 返回结果数据 |
| +text | string | 待分析文本 |
| +segment | array of objects | 词汇数组,每个元素对应结果中的一个词 |
| ++word | string | 词汇字符串 |
| ++offset | int | 词在原文的起始位置 |
| ++length | int | 词长度 |
| ++pos | string | 当前分词对应的词性 |
| ++basic_words | array of strings | 构成词的子部分 |
| code | int | 返回码: 0表示成功 1001表示错误的命令请求格式:如JSON格式错误 2000 表示请求的操作超时终止:如模块处理超时 2001 表示未执行请求的操作:如文本超过指定长度 |
| message | string | 返回信息 |
{
"data": {
"text": "阳光保险集团股份有限公司于2005年7月成立",
"segment": [
{
"offset": 0,
"pos": "nt",
"basic_words": [
"阳光保险集团",
"股份有限公司"
],
"length": 12,
"word": "阳光保险集团股份有限公司"
},
{
"offset": 12,
"pos": "p",
"basic_words": [],
"length": 1,
"word": "于"
},
{
"offset": 13,
"pos": "t",
"basic_words": [
"2005",
"年",
"7月"
],
"length": 7,
"word": "2005年7月"
},
{
"offset": 20,
"pos": "v",
"basic_words": [],
"length": 2,
"word": "成立"
}
]
},
"code": 0,
"message":
"success"
}{ "data": { "text": "阳光保险集团股份有限公司于2005年7月成立", "segment": [
{ "offset": 0, "pos": "nt", "basic_words": [ "阳光保险集团", "股份有限公司"
], "length": 12, "word": "阳光保险集团股份有限公司"
},
{ "offset": 12, "pos": "p", "basic_words": [], "length": 1, "word": "于"
},
{ "offset": 13, "pos": "t", "basic_words": [ "2005", "年", "7月"
], "length": 7, "word": "2005年7月"
},
{ "offset": 20, "pos": "v", "basic_words": [], "length": 2, "word": "成立"
}
]
}, "code": 0, "message": "success"}| 分词词性标签 | 释义 | 举例说明 |
|---|---|---|
| n | 名词 | 余额、手机 |
| nr | 人名 | 张三、老李 |
| nrj | 日语人名 | 福原爱、小栗旬 |
| nrf | 音译人名 | 卡尔·马克思、C.S.刘易斯 |
| ns | 地名 | 北京市、海淀区 |
| nsf | 音译地名 | 纽约市、曼哈顿区 |
| nz | 其他专名 | 西安事变、红楼梦 |
| nx | 字母词 | CPU、log |
| nba | 动物名 | 东北虎、阿拉斯加犬 |
| nbp | 植物名 | 波斯菊、牵牛花 |
| nf | 食物名 | 薯片、米粉 |
| nnd | 职业 | 文秘、教师 |
| nnt | 职务 | 校长、经理 |
| nhd | 疾病 | 感冒、发烧 |
| nhm | 药品 | 乳酸菌素片、藿香正气水 |
| nmc | 化学品名 | 乙醇、甲醇 |
| nt | 机构团体名(包括政府机 构) | 联合国、教育部 |
| nis | 机构后缀 | 学院、大学 |
| ntc | 公司名 | 玖富、百度 |
| ntcb | 银行 | 中国银行、招商银行 |
| ntcf | 工厂 | 富士康 |
| ntch | 酒店宾馆 | 全季酒店 |
| nth | 医院 | 北医三院 |
| nts | 中小学 | 北大附小 |
| ntu | 大学 | 北京大学 |
| v | 动词 | 吃、看 |
| vshi | 动词“是” | 是、不是 |
| vyou | 动词“有” | 有、没有 |
| vf | 趋向动词 | 上去、下来 |
| vn | 名词性动词 | 指挥、通知 |
| vd | 能愿动词 | (不)能、(不)可以 |
| vx | 形式动词 | 进行、加以 |
| vi | 不及物动词 | 吃饭、开会 |
| vl | 动词性惯用语 | 吃不了兜着走 |
| a | 性质形容词 | 宽大、容不容易 |
| z | 状态形容词 | 胖胖的、笔直 |
| an | 形容词性名词 | 困难、痛苦 |
| ad | 形容词性副词 | 深入、容易 |
| d | 副词 | 很、非常 |
| t | 时间词 | 周一、五点 |
| s | 处所词 | 手头、家里 |
| f | 方位词 | 前、后、上、下 |
| b | 区别词 | 雄、雌、公共、半自动 |
| m | 数词 | 一、第一 |
| mq | 数量词 | 点、一点 |
| q | 量词 | 本、个、个个 |
| qv | 动量词 | 趟、下 |
| qt | 时量词 | 天、小时 |
| r | 代词 | 这下、这下子 |
| rr | 人称代词 | 你、我、他 |
| rz | 指示代词 | 这个、那样 |
| rzt | 时间指示代词 | 这天、这时 |
| rzs | 地点指示代词 | 这里、这儿 |
| rzv | 谓词性指示代词 | 看语境:这样 |
| ry | 疑问代词 | 什么、怎样 |
| ryt | 时间疑问代词 | 多久、何时 |
| rys | 处所疑问代词 | 哪里、哪儿 |
| ryv | 谓词性疑问代词 | 看语境:干嘛、怎么办 |
| p | 介词 | 在、为了 |
| pba | 介词“把” | 把 |
| pbei | 介词“被” | 被 |
| c | 连词 | 因为、虽然 |
| cc | 并列连词 | 和、还是 |
| u | 助词 | 也罢、得慌 |
| uzhe | 助词“着” | 着 |
| ule | 助词“了” | 了 |
| uguo | 助词“过” | 过 |
| ude1 | 助词“的” | 的 |
| ude2 | 助词“地” | 地 |
| ude3 | 助词“得” | 得 |
| usuo | 助词“所” | 所 |
| udeng | 助词“等” | 等、云云、之类 |
| uyy | 助词“一样” | 一样、似的、一般 |
| udh | 助词“的话” | 的话 |
| uls | 助词“来说” | 来说、来讲、而言、而论 |
| uzhi | 助词“之” | 之 |
| ulian | 助词“连” | 连 |
| e | 叹词 | 哎呀、天哪 |
| o | 拟声词 | 哗啦、扑通、滴答 |
| y | 语气词 | 了、呢、吧 |
| i | 成语 | 兢兢业业、说一不二 |
| h | 前缀 | 阿(婆)、老(爸) |
| k | 后缀 | (学)者、(桌)子 |
| g | 语素字 | (五点)时 |
| ng | 名词性语素 | (出了五天)差 |
| vg | 动词性语素 | (街头)现(新型诈骗手段) |
| tg | 时间词语素 | (上大学)时 |
| ag | 形容词性语素 | 众(明星)、(事故)频(发) |
| xx | 非语素字 | 葡、萄 |
| w | 标点符号 | !、。 |