テキスト内の漢数字を一括抽出するツール|大字/小数点/無量大数/最小最大文字数

目次

漢数字抽出ツール

抽出する対象
数字の種類
抽出する漢数字の文字数
抽出結果の形式
出力から削除
区切り文字
囲い文字

入力欄

抽出結果(コピペ用)

※ブラウザ上で処理するため、サーバーに入力した文字を送信することはありません。

差分

ツールの説明

文章の中から漢数字の文章を抜き出すツールです。

抽出する対象

「漢数字」は下記のような漢数字が抽出対象となります。

〇,一,二,三,四,五,六,七,八,九,十,百,千,万,億,兆

「現大字」は下記のような漢数字が抽出対象となります。

零,壱,弐,参,肆,伍,陸,漆,捌,玖,拾,陌・佰,阡・仟,萬,億,兆

「旧大字」は下記のような漢数字が抽出対象となります。

零,壹,貳・貮,參,肆,伍,陸,漆,捌,玖,拾,陌・佰,阡・仟,萬,億,兆

「小数点表記」は下記のように漢数字と・(中黒)の組み合わせが抽出対象となります。

〇・一

「小数点以下/割合」は下記のような漢数字が抽出対象となります。

小数点以下: 分,厘,毛,糸,忽,微,繊,沙,塵,埃,渺,漠,模糊,逡巡,須臾,瞬息,弾指,刹那,六徳,虚空,清浄
例: 「一分五厘」

割合: 割,分,厘
例: 「三割八分九厘」

「京~無量大数」は下記のような漢数字が抽出対象となります。

京,垓,秭,穣,溝,澗,正,載,極,恒河沙,阿僧祇,那由他,不可思議,無量大数

「無量大数より大きな数」は下記のような漢数字が抽出対象となります。

洛叉,倶胝,阿庾多,那由他,頻波羅,矜羯羅,阿伽羅,最勝,摩婆羅,阿婆羅,多婆羅,界分,普摩,禰摩,阿婆鈐,弥伽婆,毘攞伽,毘伽婆,僧羯邏摩,毘薩羅,毘贍婆,毘盛伽,毘素陀,毘婆訶,毘薄底,毘佉擔,称量,一持,異路,顛倒,三末耶,毘睹羅,奚婆羅,伺察,周広,高出,最妙,泥羅婆,訶理婆,一動,訶理蒲,訶理三,奚魯伽,達攞歩陀,訶魯那,摩魯陀,懺慕陀,瑿攞陀,摩魯摩,調伏,離憍慢,不動,極量,阿麼怛羅,勃麼怛羅,伽麼怛羅,那麼怛羅,奚麼怛羅,鞞麼怛羅,鉢羅麼怛羅,尸婆麼怛羅,翳羅,薜羅,諦羅,偈羅,窣歩羅,泥羅,計羅,細羅,睥羅,謎羅,娑攞荼,謎魯陀,契魯陀,摩睹羅,娑母羅,阿野娑,迦麼羅,摩伽婆,阿怛羅,醯魯耶,薜魯婆,羯羅波,訶婆婆,毘婆羅,那婆羅,摩攞羅,娑婆羅,迷攞普,者麼羅,駄麼羅,鉢攞麼陀,毘迦摩,烏波跋多,演説,無尽,出生,無我,阿畔多,青蓮華,鉢頭摩,僧祇,趣,至,阿僧祇,阿僧祇転,無量,無量転,無辺,無辺転,無等,無等転,不可数,不可数転,不可称,不可称転,不可思,不可思転,不可量,不可量転,不可説,不可説転,不可説不可説,不可説不可説転

「十や百の倍数の特殊な表記」は下記のような漢数字が抽出対象となります。

廿(二十と同義), 卅(三十と同義), 卌(四十と同義), 皕(二百と同義)

抽出結果の重複削除

文章の中から抽出した漢数字の中から、重複する時刻を削除して一意の漢数字のみの一覧として出力することができます。

抽出結果の区切り文字

抽出した括弧の文章一覧の区切り文字を改行・カンマ・タブ・半角スペースから選ぶことができます。

改行区切りであれば一般的な一覧として出力されます。

カンマ区切りであれば CSV (Comma Separated Values) に、タブ区切りであれば TSV (Tab Separated Values) に、半角スペース区切りなら SSV (Space Separated Values) のデータとして使える……かもしれませんね。

抽出結果の囲い文字

抽出した括弧の文章一覧の各行をダブルクォーテーションかシングルクォーテーションで囲うことができます。

抽出結果を何かしらのデータとして扱いたい場合に、文字列であることを明確にするために囲い文字で囲いたい場合が……あるかもしれませんね。

よかったらシェアしてね!
目次