APIリファレンス (API Reference)
DataFrame アクセサ (.ja)
polars.DataFrame に追加される .ja アクセサのメソッドです。
polars_japanese.common.JapaneseDataFrame
write_csv(path, encoding='utf-8', **kwargs)
指定されたエンコーディングでDataFrameをCSVファイルに書き込みます。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
path
|
Union[str, Path]
|
CSVファイルを書き込むパス。 |
required |
encoding
|
str
|
出力ファイルに使用するエンコーディング。 デフォルトは "utf-8"。 |
'utf-8'
|
**kwargs
|
Any
|
|
{}
|
Raises:
| Type | Description |
|---|---|
LookupError
|
指定されたエンコーディングが無効な場合に発生します。 |
Examples:
Expression アクセサ (.ja)
polars.Expression に追加される .ja アクセサのメソッドです。
polars_japanese.common.JapaneseExpr
to_half_width()
エクスプレッションの文字列に含まれる全角文字を半角に変換します。 カタカナ、ASCII、数字に適用されます。
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 半角に変換された文字列を含むエクスプレッション。 |
to_full_width()
エクスプレッションの文字列に含まれる半角文字を全角に変換します。 カタカナ、ASCII、数字に適用されます。
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 全角に変換された文字列を含むエクスプレッション。 |
normalize()
式内の日本語テキストを正規化します。
まずNFKC正規化を適用し、その後以下の特定のルールを適用します: - ハイフン/マイナス記号を半角'-'に統一 - 長音記号を全角'ー'に統一 - チルダを全角'~'に統一 - 感嘆符を半角'!'に統一 - 疑問符を半角'?'に統一 - スペースを半角スペース' 'に統一
正規化ルールは以下を参考にしています: https://github.com/ikegami-yukino/jaconv
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 正規化された文字列を表す式 |
to_datetime(format='%-K%-y年%m月%d日', raise_error=True)
和暦文字列を Polars の Date 型に変換します。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
format
|
str
|
和暦のフォーマット文字列。 |
'%-K%-y年%m月%d日'
|
raise_error
|
bool
|
変換エラー時に例外を発生させるかどうか。 |
True
|
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: Date 型に変換されたエクスプレッション。 |
References
to_wareki(format='%-K%-Y年%m月%d日', raise_error=True)
エクスプレッションのDateまたはDatetimeを和暦の文字列形式に変換します。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
format
|
str
|
出力する和暦のフォーマット文字列。 |
'%-K%-Y年%m月%d日'
|
raise_error
|
bool
|
変換エラー時に例外を発生させるかどうか。 |
True
|
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 和暦文字列に変換されたエクスプレッション。 |
References
to_kanji(config=None)
エクスプレッションのIntを漢数字の文字列形式に変換します。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
config
|
Optional[KanjizeConfiguration]
|
kanjize の設定。 |
None
|
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 漢数字文字列に変換されたエクスプレッション。 |
References
to_number()
エクスプレッションの漢数字を数値に変換します。
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 数値に変換されたエクスプレッション (Int64)。 |
References
is_holiday()
指定された日付が祝日かどうかを判定します。
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 祝日の場合は True、そうでない場合は False を含む Boolean エクスプレッション。 |
is_business_day()
指定された日付が営業日かどうかを判定します。 (土日祝日でない場合に True)
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 営業日の場合は True、そうでない場合は False を含む Boolean エクスプレッション。 |
to_weekday_name(format='%A')
Date型またはDatetime型のエクスプレッションを日本語の曜日文字列に変換します。
入力データがNoneの場合はNoneを返します。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
format
|
str
|
出力フォーマット。 "%A" (デフォルト): "月曜日", "火曜日", ... "%a": "月", "火", ... |
'%A'
|
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 日本語の曜日文字列を含むエクスプレッション。 |
Raises:
| Type | Description |
|---|---|
ValueError
|
サポートされていないフォーマットが指定された場合。 |
to_jst(time_zone=None)
Datetime型のエクスプレッションを日本標準時(JST, UTC+9)に変換します。
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
time_zone
|
str | None
|
入力データのタイムゾーン。 Noneの場合、naive datetimeはUTCとみなされます。 タイムゾーンが指定された場合、入力データはそのタイムゾーンとして解釈されます。 |
None
|
Returns:
| Type | Description |
|---|---|
Expr
|
pl.Expr: 日本標準時(JST)に変換されたDatetime型のエクスプレッション。 |
都道府県関連アクセサ (.ja.pref)
polars.Expression に追加される .ja_pref アクセサを通じて利用できる都道府県関連の処理です。
polars_japanese.prefecture.PrefectureExpr
to_code()
都道府県名(漢字、ひらがな、カタカナ、ローマ字、コード)を都道府県コードに変換します。
表記揺れ(「県」の有無など)も吸収します。 該当しない場合はnullになります。
to_kanji()
都道府県名またはコードを正式な漢字表記(例:「東京都」「神奈川県」)に変換します。
入力が都道府県名の場合、まずコードに変換してから漢字表記にします。 該当しない場合はnullになります。
to_hiragana()
都道府県名またはコードを正式なひらがな表記に変換します。
該当しない場合はnullになります。
to_katakana()
都道府県名またはコードを正式なカタカナ表記に変換します。
該当しない場合はnullになります。
to_romaji()
都道府県名またはコードを一般的なローマ字表記に変換します。
該当しない場合はnullになります。
to_region()
都道府県名またはコードを地方名に変換します。
該当しない場合はnullになります。 地方: - 北海道 - 東北 - 関東 - 中部 - 近畿 - 中国 - 四国 - 九州・沖縄