#!/usr/bin/perl

# get_noun_list.plの出力ファイルから、各名詞の使用回数をカウントして出力する。
# perl noun_count_per_book get_noun_list.plの出力ファイル > 出力ファイル

use strict;
use warnings;
use Encode qw/decode/;
use Encode qw/encode/;
use utf8;

open IN, "$ARGV[0]" or die;
my %count = ();
while (<IN>) {
	chomp;
	my $line = decode('UTF-8', $_);
	my($isbn, $sentence, $noun_list) = split /\t/, $line;
	my @nouns = split /, /, $noun_list;
	foreach my $noun (@nouns) {
		++$count{$noun};
	}
}
close IN;

my %data = ();
foreach my $noun (sort { $count{$b} <=> $count{$a} } keys %count) {
	print encode('UTF-8', "$noun\t$count{$noun}\n");
}
