牛客题目链接:https://ac.nowcoder.com/acm/problem/16864
题目描述:
在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里。为了提高查找和定位的速度,通常都要画出与单词列表所对应的单词查找树,其特点如下
(1). 根节点不包含字母,除根节点外每一个节点都仅包含一个大写英文字母;
(2).从根节点到某一节点,路径上经过的字母依次连起来所构成的字母序列,称为该节点对应的单词。单词列表中的每个词,都是该单词查找树某个节点所对应的单词;
(3).在满足上述条件下,该单词查找树的节点数最少。
例:图一的单词列表对应图二的单词查找树
输入描述:
为一个单词列表,每一行仅包含一个单词和一个换行/回车符。每个单词仅由大写的英文字符组成,长度不超过63个字符。
文件总长度不超过32K,至少有一行数据。
输出描述:
该文件中仅包含一个整数和一个换行/回车符。该整数为单词列表对应的单词查找树的节点数。
示例1
输入1:
A
AN
ASP
AS
ASC
ASCII
BAS
BASIC
输出:
13
这个题目本质是模拟一棵多叉树,由于由于字符只取大写英文字符,因此最多可能有26个分叉。
一般来说直接用指针数组模拟分叉需要26个,但是也可能只有少数几个分支。
因此我们引入哈希表来快速查找分支和去除空指针分支。
代码:
#include<iostream>
#include<unordered_map>//hashmap
using namespace std;
struct Node {char c; //当前节点的值unordered_map<char, Node*>um; //路径中下一个值和节点对应Node(char c) {this->c = c;}
};
void func(Node* node, string& str, int& cur) {if (node->um.find(str[cur]) == node->um.end()) { //如果在当前树中找不到待查找节点Node* tmp = new Node(str[cur]); //创建新节点node->um[str[cur]] = tmp; //加入新节点if (cur + 1 < str.size()) {++cur;func(tmp, str, cur);}}else {if (cur + 1 < str.size()) { //存在当前节点++cur;func(node->um[str[cur - 1]], str, cur);}}
}
int cnt = 0;
//多叉树后序遍历统计总节点数
void run(Node* node) {for (auto it : node->um) {run(it.second);}++cnt;
}
int main() {Node* root = new Node(0);string str;while (cin >> str) {int cur = 0;func(root,str,cur);}run(root);cout << cnt << endl;
}