算法笔记

分享技能,记录生活,刷题笔记

  • 首页
  • 信息时代
    • 地理信息
    • python
    • easticsearch
    • NLP
    • CV
    • git
    • matlab
    • Linux
  • 生活/情感
  • 数据集
  • 刷题笔记
  • 算法手撕
  • 论文阅读
    • 实体识别-ner
    • 大模型-llm
    • text2sql-文本转sql
  • 文章归档

N-gram简单有效的统计语言模型

1743 views

1 N-gram统计语言模型

通常n采用1-3之间的值,它们分别称为unigram、bigram和trigram

  • 计算demo: 现有给定训练语料合计三个文档如下:
D1: John re...

Read more

发布于 NLP 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2018-08-13

文章导航

较新文章 →

Views

  • GEE学习笔记(25): 植被指数的计算(2)-窄带绿度 - 2919 views
  • GEE学习笔记(24): 植被指数的计算(1)-宽带绿度 - 2409 views
  • 正弦位置编码 - 2328 views
  • 客户端连接远程服务器的Jupyter - 2215 views
  • word2vector-情感分析demo - 2091 views
  • GEE学习笔记(23): 通过阈值法对水体信息进行提取 - 2084 views
  • GEE学习笔记(20): 统计不同土地利用类型的面积 - 1852 views
  • 牛客网-NC140 排序 - 1772 views
  • DjangoBlog-部署记录 - 1753 views
  • N-gram简单有效的统计语言模型 - 1743 views

分类目录

  • matlab
  • text2sql-文本转sql
  • 大模型-llm
  • 实体识别-ner
  • 论文阅读
  • 算法手撕
  • Linux
  • 刷题笔记
  • 数据集
  • 信息时代
  • git
  • CV
  • NLP
  • easticsearch
  • python
  • 地理信息
  • 生活/情感

近期文章

  • Qwen2.5-VL:图片处理成token
  • text2sql论文15:You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL
  • MOE-算法
  • 实现 strStr() 函数-KMP
  • 手撕selfAttention和MHA
  • DPO、PPO和GRPO的伪代码loss计算
  • text2sql:粗略方案
  • text2sql论文14:Tool-Assisted Agent on SQL Inspection and Refinement in Real-World Scenarios
  • text2sql论文13-XiYan-SQL:一种多生成器集成的Text-to-SQL框 架
  • Linux 打印文本部分行内容(前几行,指定行,中间几行,跨行,奇偶行,后几行,最后一行,匹配行)

标签云

GEE 自然语言处理 python 机器学习 NLP matlab 地理

欢迎您STAR或者FORK本站源代码

GitHub stars GitHub forks

功能

  • 管理站点
  • 登录
  • GitBook
Copyright© 2025  算法笔记  |  SiteMap  |  RSS Feed  |  友情链接 |  Hosting On  Linode |  百度统计
Powered by Django  |  liangliangyy | lylinux | 本页面加载耗时:0.186s

浙ICP备2022004686号-1