現場での実践SQL（２）

　今回は抽出の基本、一番単純な単一テーブルからの抽出についてまとめます。
　実践でSQLを作成する場合、原則、プライマリーキーもしくはインデックスが作成されていない項目に対して抽出を行うことはご法度です。
　もし、どうしてもプライマリーキーもしくはインデックスが作成されていない項目を抽出に指定しなければならない場合は、レスポンスを計測し本番環境で使用して問題がないか、十分に検討する必要があります。

単一テーブルからの抽出

　単一テーブルから抽出するパターンです。

１－１．プライマリーキー、インデックスでの抽出比較

　上図の通り、プライマリーキーでの抽出、インデックスでの抽出、なしの場合を考えます。

①プライマリーキーでの抽出

select *
from A
where KEY='999999';

②インデックスでの抽出

select *
from A
where INDEX='9999990';

③プライマリーキー、インデックスなしの抽出

select *
from A
where DATA='99999900';

　ハードの性能に大きく左右されますが、Corei7(2.3GB)、メモリ4GBの環境で実行した結果、
・①が最速で0.000秒
・②は①より若干遅い0.015秒
・③は大きく速度低下して0.297秒
　でした。
　プライマリキー、インデックスのない項目で抽出するとレスポンスが悪く、原則、使用してはいけません。単一レコードの抽出ではこの程度ですが、複数テーブルの場合はさらにレスポンスが悪化します。

１－２．インデックスの効果（ガーディナリティ）

　インデックスについては、項目の内容によってその速度効果が大きく異なります。これは一般的にガーディナリティと呼ばれるデータの重複度に依存します。
　例えば有/無のみが入力される項目があったとして100万レコード存在する場合、内容としては100万レコードであれ有/無の2種類のみ。つまりグループ化した結果数は2。同じく重複度を示すガーディナリティは2ということになります。この2種類しかない項目にインデックスを付与しても、その速度改善は期待できません。
　対して、100万レコードに各々違う値が入っている場合、ガーディナリティは100万。この項目にインデックスを付与すれば速度改善が期待できるということになります。
　つまり、インデックスはガーディナリティの大きい場合に付与すると速度効果が期待できるものです。

各インデックスのガーディナリティは以下コマンドで確認することができます。

show index from A;

　～　結果　～　

１－３．項目の型が文字列の場合の抽出比較

　上記１－１はint型の例でしたが、仮に全ての項目を文字列型(char、varchar等)にした場合、レスポンス速度は遅くなります。
　①が0.410秒。②は0.416秒。③は0.461秒でした。
　プライマリキーが文字列型であることは、現場では原則ありえませんが、インデックスの場合、どうしても文字列に使用しなければならない場面がありますが、あえて使用する場合にはレスポンスを十分チェックしなければなりません。

１－４．EXPLAINによるSQL分析

　SQLの頭に「EXPLAIN」と入れることでそのSQLを評価することができます。大規模DBを扱ったことがある技術者は必ずこの評価を実施します。上記１－１の３パターンの結果は以下のように表示されます。
　見るべき項目は「type」と「rows」です。

　※このSQL分析については各DBMSによって方法が違います。これはMySQLのケースです。

①プライマリーキーでの抽出

EXPLAIN
select *
from A
where KEY='999999';

　～　結果　～　

　「type」項目にconstと表示される場合はプライマリーキーが利用されている一番望ましい状態です。

②インデックスでの抽出

EXPLAIN
select *
from A
where INDEX='9999990';

　～　結果　～　

　「type」項目にrefと表示される場合はインデックスが利用されている状態です。

③プライマリーキー、インデックスなしの抽出

EXPLAIN
select *
from A
where DATA='99999900';

　～　結果　～　

　「type」項目にALLと表示される場合は何のキーも適用できていない改善が必要な状態です。
　さらに「rows」項目に何レコードから抽出するかを表す概算レコード数が表示されます。
　この場合、約100万レコードからの抽出となるので、レスポンスに時間がかかるということになります。

１－５．IN、LIKEによる抽出

　抽出条件に、「=」ではなく、IN、LIKEを利用する場合を検証します。

①INでの抽出

EXPLAIN select *
from A
where KEY in ('1','2');

　～　結果　～　

　「type」項目にrangeと表示される範囲検索の状態です。プライマリキーないしはインデックスキー項目を利用すれば速度的に問題ありません。ちなみに「rows」に2と表示されているのはINの後ろが（）で囲まれており、サブクエリの状態となっているからです。()内にSQL文を書くこともできますが、この例では直接値を、2つ指定しています。これが「rows」に表示されています。

②LIKEでの抽出

EXPLAIN select *
from A
where KEY like '1%';

　～　結果　～　

　LIKEは部分一致を指定する抽出です。例の「1%」は先頭が1から始まる前方一致で、1、10,11,100などが抽出されます。「%1」とすると後方一致。「%1%」とすると部分一致です。
　LIKEの場合、「type」項目にALLと表示されます。つまり、何のキーも適用できていない状態です。どうしても使用しなければならない場合もあるかもしれませんが、速度が遅くなることを覚悟する必要があります。

１－６．サブクエリ（副問い合わせ）について

　サブクエリとは、SQL文の中に、入れ子でSQL文を書く方法です。WHERE条件にサブクエリを指定して利用することができます。

サブクエリを利用した抽出

select *
from A
where KEY=(select KEY from A where INDEX='20');

　この場合、内部的にはサブクエリの「select KEY from A where INDEX='20'」から抽出され、その結果が出た後、メインのクエリ「select * from A where KEY=(サブクエリの結果)」が実行されます。
従って、各々が適切にプライマリキーないしはインデックスを利用して抽出を行えば、2回に分けて適切なSQLが実行されることとなり、何ら、抽出速度に影響することはありません。

　例では、サブクエリの評価を「=」で行いましたが、１－５のように、「IN」も利用できます。

１－７．その他抽出

　～　LIMIT　～　

　LIMITはテーブルの範囲を指定して抽出するときに利用します。

LIMITによる範囲指定①

select *
from A
limit 0,10;

　この例では、レコードの先頭(第１引数:0)から、10レコード(第２引数:10)抽出しています。尚、この順序ですが、テーブルのプライマリキー順です。抽出速度は非常に速いです。テーブル入っているそのままのレコードの並び順通り、範囲を指定して抽出しているだけだからです。当然、ORDER BY DESC(降順)を抽出条件に指定してしまうと、並べ替え作業が発生してしまうので抽出速度は悪化します。

LIMITによる範囲指定②

select *
from A
where INDEX<=1000
limit 10,10;

　この例ではWHEREで条件を指定した上で、11レコード(第１引数:10)から、10レコード(第２引数:10)抽出しています。第1引数は0が1レコード目としますので、+1となります。

　このLIMITは、高速で抽出できることを利用し、「＞」「＞＞」ボタンを配置しながら大量のレコードを画面表示する画面インターフェースを作成する場合によく利用されます。

　～　正規表現の利用　～　

　WHERE条件に正規表現を利用することが出来ます。

select *
from A
where INDEX regexp '^1';

　利用することはできますが、１－５のLIKEと同じく、何のキーも適用できていない状態となりますので抽出速度は非常に遅いです。利用には十分注意が必要です。

　～　WHERE 1=1のおまじない　～　

　WHERE条件の先頭にWHERE 1=1を記載することを、ルールとして決めている現場がたまにあります。そもそもWHERE 1=1という条件は必ずTRUEとなる条件です。書いても書かなくても抽出結果に変わりはないのですが、何故書くのでしょう。

select *
from A
where WHERE 1=1
and KEY='100'
and INDEX='1000'
and DATA='10000';

　このように、AND条件が多くなると、WHEREの条件はインデントがずれているので、抽出条件として見落とされる可能性があります。これを避けるため、つまりプログラムの視認性のためにWHERE 1=1は現場で書かれています。

ハードウェア
第13世代 Intel CPU（Raptor Lake）	2022/10月
第6世代 AMD CPU（Zen4）	2022/10月
メモリ DDR5	2021/10月
USB4.0（転送速度40Gbps）	2020/10月
移動通信 5G（通信速度10Gbps以上）	2020/04月
Microsoft Windows
Windows11	2021/10/04
Microsoft Windows Server
Windows Server 2022	2021/08/18
Microsoft Office
Office 2021	2021/10/15
Microsoft SQL Server
Microsoft SQL Server 2022	2022/01月
Oracle Database
22c　(LTR:Long Term Release)	2022年07月
Java
SE 17	2021年09月
Microsoft Visual Studio
Microsoft Visual Studio 2022	2021/11/08
その他
Adobe Creative Cloud(CC)2020	2019年10月
.NET 6	2021/11/08

Microsoft Windows
Windows 8.1	2023/01/10
Windows 10	2025/10/14
Windows 11	サポート中
Microsoft Windows Server
Windows Server 2012 / R2	2023/01/10
Windows Server 2016	2027/01/11
Windows Server 2019	2029/01/08
Windows Server 2022	2031/10/14
Microsoft Office
Office 2013	2023/04/11
Office 2016	2025/10/14
Office 2019	2025/10/14
Office 2021	2026/10/13
Microsoft SQL Server
Microsoft SQL Server 2012	2022/07/12
Microsoft SQL Server 2014	2024/07/09
Microsoft SQL Server 2016	2026/07/14
Microsoft SQL Server 2017	2027/10/12
Microsoft SQL Server 2019	2030/01/08
Oracle Database
11g	2020年12月
12c	2025年03月
18c	2021年06月
19c　(LTR:Long Term Release)	2027年04月
21c	2023年06月
Java
SE 7(延長サポート)	2022年07月
SE 8(延長サポート)	2025年03月
SE 11(延長サポート)	2026年09月
SE 17(延長サポート)	2029年09月
Microsoft Visual Studio
Microsoft Visual Studio 2012	2023/01/10
Microsoft Visual Studio 2013	2024/04/09
Microsoft Visual Studio 2015	2025/10/14
Microsoft Visual Studio 2017	2027/04/13
Microsoft Visual Studio 2019	2029/04/10
Microsoft Visual Studio 2022	2032/01/13
その他
Adobe Flash	2020/12/31
Microsoft Silverlight	2021/10/21
.NET Framework3.5	2029/01/09
.NET Framework4.8	未定(開発終了)
.NET 6	サポート中

現場での実践SQL（２）

目次

単一テーブルからの抽出

１－１．プライマリーキー、インデックスでの抽出比較

１－２．インデックスの効果（ガーディナリティ）

１－３．項目の型が文字列の場合の抽出比較

１－４．EXPLAINによるSQL分析

１－５．IN、LIKEによる抽出

１－６．サブクエリ（副問い合わせ）について

１－７．その他抽出

プログラム言語別学習サイト

人気のある記事

IT Service Start HeadLine

IT Support End HeadLine

運営者情報

おすすめの関連記事