MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

MySQL

2016-09-14 09:44 (9 years ago)

まったく定量的な話でないのですが。

某サービスで、MyISAM のテーブルのフィールドにフルテキストインデックスをつけて、バイグラムで検索インデックスを入れてました。20万レコードぐらい。

今までは、そのフィールドの文字コードの照合順序 ( collate ) は utf8_general_ci (デフォルト) だったんですが、日本語でカタカナ平仮名両方マッチさせたいので、collate を utf8_unicode_ci に変えてみたんです。

そうしたら、パフォーマンスが極端に悪くなり全然サービスが動かなくなってしまって。SHOW FULL PROCESSLIST; 見たら検索クエリが詰まってる。

ということで、utf8_unicode_ci やめて元に戻しました。日本語のカタカナ平仮名のゆれは、検索データを入れる際にノーマライズして入れることにしました。

utf8_unicode_ci やめといたほうがいい、という話。というか検索系は MySQL + フルテキストインデックスでやるより、Elasticsearch とか Cloudsearch とか使ったほうが良いですね。

評価をお願いします（会員登録・ログイン不要）

まだ評価がありません

Django で Shift-JIS の CSV を出力

Disqusを使ってる場合、iOS の Twitter アプリでページを表示すると外部サイトリンクに問題あるかも

著者は、アプリケーション開発会社 Cyberneura を運営しています。
開発相談をお待ちしています。

株式会社 Cyberneura を見る

新着記事

アーカイブ

2026

6月 (1)5月 (9)4月 (1)3月 (4)2月 (6)1月 (4)

2025

8月 (2)7月 (1)5月 (3)4月 (1)3月 (2)1月 (1)

2024

12月 (2)9月 (1)7月 (3)6月 (3)5月 (2)4月 (1)3月 (2)2月 (1)1月 (1)

2023

12月 (3)11月 (2)10月 (2)9月 (1)8月 (3)7月 (3)6月 (1)5月 (5)4月 (2)3月 (4)2月 (1)1月 (4)

2022

12月 (3)11月 (6)10月 (5)9月 (10)8月 (3)7月 (2)6月 (4)5月 (1)4月 (3)3月 (1)2月 (1)1月 (2)

2021

12月 (7)11月 (4)10月 (3)8月 (4)7月 (1)6月 (1)3月 (7)2月 (7)1月 (6)

2020

11月 (3)10月 (2)9月 (1)8月 (1)7月 (3)6月 (1)5月 (3)2月 (1)1月 (2)

2019

12月 (2)9月 (2)7月 (1)6月 (3)5月 (1)3月 (2)2月 (2)

2018

12月 (1)10月 (1)9月 (8)8月 (2)7月 (3)6月 (2)5月 (3)3月 (2)2月 (6)1月 (4)

2017

12月 (2)10月 (1)9月 (4)8月 (2)6月 (2)5月 (3)4月 (2)3月 (6)2月 (6)1月 (2)

2016

9月 (3)6月 (1)1月 (1)

2015

12月 (5)11月 (2)10月 (5)9月 (4)8月 (4)7月 (2)6月 (5)5月 (3)3月 (1)

2014

6月 (6)5月 (1)4月 (4)3月 (1)2月 (1)1月 (2)

2013

11月 (3)10月 (1)9月 (4)8月 (3)

2012

3月 (1)

2011

12月 (1)9月 (2)7月 (1)6月 (23)

MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

最近の投稿

最近の製作物

カテゴリ

アーカイブ

MySQL の 照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

最近の投稿

最近の製作物

カテゴリ

アーカイブ

MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき