R5 午後1 問3 設問2 (2)(3)

赤茶べこさん  
(No.1)
問題文 「2.性能見積もり」に「100日間の観測データ144,000行を読み込むことを仮定した~」とありますが、当仮定に則った場合、圃場は1つしか存在しないことにならないでしょうか?

というのも、観測データは圃場ごと1分ごとに登録されるため、1圃場1日当たり1,440行登録されるはずです。問題文には「100日間の観測データ144,000行」と記載されており、この条情報と整合性をとるためには1つの圃場由来のデータしか観測データとして存在できていないのでは?と考えました。
上記認識が正しい場合、表6のページ数に関数る情報や設問2(2)(3)のとらえ方にも影響があると思い、質問させていただきます。何卒よろしくお願い申し上げます。
2024.09.10 03:19
バナナさん 
(No.2)
回答ではなくて申し訳ありません。
拝読して私も「確かに」と思いました。
圃場IDが1つでしたら、表6の区分化前の読み込みページ数は144,000ではなさそうですね。

どなたかお分かりになる方いらっしゃいましたらお願いいたします。
2024.09.12 18:42
しろみさん 
(No.3)
性能見積をするために、1つの圃場だけを対象にしたと思います。
2024.09.12 22:37
赤茶べこさん  
(No.4)
ご意見、アドバイスありがとうございます!!!

>性能見積をするために、1つの圃場だけを対象にしたと思います。
性能見積もりのため1圃場由来のデータしか登録されていない試験データを用いていたと考えた場合、圃場IDは1つしかないことになるため、区分化前の状態ですでに圃場ID、農事日付順にレコードが並ぶと思います。この状況で、副次索引(圃場ID, 農事日付)を使用してレコードを読み込んだ場合、読み込みたいレコードがページ内に連続して存在するため、読み込みページ数は最小で144,000/4=3600[ページ]になると思うのですが、表6を見たところ144,000[ページ]となっております。したがって、表6の観測テーブルのデータには複数圃場由来のデータが含まれているものと思いました。
また、(3)の解答が「同じ圃場の行は1ページに1行しか格納できないから」ということからも、複数圃場由来のデータが含まれているものと思いました。

表6作成時の前提が書かれていないから、表内の値間で齟齬があるように感じてしまいます、難しぃ。。どなたか改めて表6についてつまびらきに説明いただければ幸いです。
2024.09.13 02:41
みかんさん 
DB ブロンズマイスター
(No.5)
圃場1つ当たりの数値で性能を比較しているだけなんじゃないの。
2024.09.13 15:45
みかんさん 
DB ブロンズマイスター
(No.6)
  1000圃場のデータがあって、その中から、とある圃場100日間・1分単位のデータを1件ずつ読み込んでいくと、合計144,000行、144,000ページ読み込むことになりました。
  上の文章を後ろから読んで、「1000圃場のデータがあって」は誤り、「1圃場のデータがあって」が正しい、なんて話はしませんよね?
2024.09.13 23:21
赤茶べこさん  
(No.7)
>1000圃場のデータがあって、その中から、とある圃場100日間・1分単位のデータを1件ずつ読み込んでいくと、合計144,000行、144,000ページ読み込むことになりました。
ご解説ありがとうございます!
1000圃場分のデータが登録されている中で、とある1つの圃場を調査対象としているSQLであれば、回答いただいた内容も理解できるのですが、SQL3では特定の圃場(1つの圃場)ではなく全圃場ごとの積算温度を調査するものと考えております。問題文中に1つの圃場を調査対象にする旨もしくはそれを示唆する旨が記載されておりましたでしょうか?
2024.09.13 23:54
みかんさん 
DB ブロンズマイスター
(No.8)
> 問題文中に1つの圃場を調査対象にする旨もしくはそれを示唆する旨が記載されておりましたでしょうか?
  特になさそうですね。
> SQL3では特定の圃場(1つの圃場)ではなく全圃場ごとの積算温度を調査するものと考えております。
  それはそうですね。では、全部の圃場データをもとに性能を数値化するべき、となるのかしら?
  とある1つのホニャララ当たりの性能(基準値)を求めておけば、100ホニャララでも1000ホニャララでも掛け算で対応できます。ですので、受験テクニックとしては、SQLの調査対象と性能比較(見積)の調査対象は一致しないのかなぁ、くらいで柔らかくまとめておけばいいんじゃないかしら。それでもやっぱりと煮詰まったら、時間を置く、というのはよくあります。
2024.09.14 00:44
赤茶べこさん  
(No.9)
>では、全部の圃場データをもとに性能を数値化するべき、となるのかしら?
>受験テクニックとしては、SQLの調査対象と性能比較(見積)の調査対象は一致しないのかなぁ、くらいで柔らかくまとめておけばいいんじゃないかしら。
私の理解不足で申し訳ないです。全圃場ではないにせよ、少数圃場由来のデータだけでは区分化による性能の向上具合がわからない考えています(後述)。受験のテクニックには精通しておらずお恥ずかしいのですが、表の穴埋め問題ではすでにすでに埋まっている箇所(ヒント)をもとに値の導出過程や問題意図を確認したうえで、実際の空欄の中身を考えるものと思っておりました。

>では、全部の圃場データをもとに性能を数値化するべき、となるのかしら?
今回の問題は、区分化することでSQL実行時の読み込みページ数を減らすことできたよ!というのが趣旨かと思います。その性能評価をするにあたり、区分化前後での読み込みページ数を比較しようぜ!という問題と理解しております。
ただ、コメントいただいたように評価対象のデータが「全部の圃場」ではない場合、仮にひとつの圃場由来のデータ100日分であった場合、区分化の恩恵を受けられないのではないでしょうか?なぜなら1つの圃場の観測データ行が時系列順に登録されている状況になっていると思いますので、必要な行がページ内で連続しているはずです。そうなる表6の区分化前の読み込みページ数が大きく減少することおよび設問2(3)の解答「同じ圃場の行は1ページに1行しか格納できないから」と齟齬が出るからおかしいなぁ…と思っておりました。
※上記過程では、ひとつの圃場由来のデータのみが調査対象内に含まれていると仮定しておりますが、それはコメントNo.1に記載した通り「100日間の観測データ144,000行を読み込むことを仮定した場合の~」という問題文の内容を尊重した推察に基づいています。別に2圃場で考えてもよいかと思いますが、その場合であっても設問2(3)の解答「同じ圃場の行は1ページに1行しか格納できないから」と齟齬が出ると思います。

>柔らかくまとめておけばいいんじゃないかしら。
いろいろ書いてしまいましたが、いただいた心掛けが大切だと痛感しました。改めて、ありがとうございます。
2024.09.14 05:53

返信投稿用フォーム

スパム防止のためにスレッド作成日から30日経過したスレッドへの投稿はできません。

その他のスレッド


Pagetop